AI 应用开发面试指南:大模型、Agent、RAG、MCP、Prompt 工程
这是一份面向后端开发者的 AI 应用开发面试指南,免费开源,涵盖大模型/LLM 面试题、Agent 面试题、RAG 面试题、MCP 协议、Prompt 工程、向量数据库、AI 系统设计等高频考点,对标 JavaGuide 的质量标准。
如果你正在准备 AI 工程师、AI 应用开发、后端转 AI、Java AI 应用开发相关岗位,这个专栏帮你把零散概念串成一套可复习、可落地的知识体系。
这应该是当前最全面系统的讲解,每一篇都花费了大量时间完善和优化,每篇文章都画了大量配图辅助理解:

发布之后,也是收到了很多读者朋友的好评和推荐。非常感谢,一定会持续用心维护!

本站所有内容都已经免费开源,欢迎一起维护完善,有帮助的话,欢迎 Star!
AI 应用开发面试怎么准备?
很多开发者碰到的困境是:Agent、RAG、MCP 这些概念看了不少,但面试一问就卡壳,要么只知道概念说不清原理,要么知道原理但搭不出东西。
这个专栏就是冲着解决这个问题来的:把 AI 应用开发的核心知识拆透,让你面试能讲清楚,上手能做出来。
如果你想先按面试题快速过一遍,可以直接看这几份模块级总结:
- AI 应用开发面试指南:AI 应用开发面试题总入口,适合先建立复习路线。
- 大模型基础面试题总结:覆盖 Token、上下文窗口、采样参数、API 调用、结构化输出和评测体系。
- AI Agent 面试题总结:覆盖 Agent Loop、Memory、Prompt、Context、MCP、Skills、Harness Engineering 和工作流。
- RAG 面试题总结:覆盖 RAG 基础、向量数据库、文档处理、检索优化、GraphRAG、知识库更新和评测。
- AI 系统设计面试题总结:覆盖生产级 AI 应用架构、模型网关、可观测、评测、安全治理和实时语音 Agent。
持续更新中
这个专栏还在持续更新,后面会补更多高频面试考点。
想了解什么主题,或者发现内容有误,直接在项目 issue 区留言就行。
1. 大模型/LLM 基础知识
做 Agent 工作流、调 RAG 检索,最容易踩坑的地方反而是最底层的 LLM 参数。比如:
- 为什么明明设置了温度为 0,结构化输出还是偶尔崩溃?
- 为什么往模型里塞了长文档后,它好像失忆了,忽略了 System Prompt 里的关键指令?
- Token 到底怎么算的?为什么中文和英文的消耗不一样?
这些问题,不搞懂 LLM 的底层原理就永远只能靠玄学调参。在《万字拆解 LLM 运行机制》中,我把 Token、上下文窗口、Temperature 这些概念还原成了清晰、可控的工程参数。
搞懂原理后,还需要知道怎么把这些模型调用落地到生产。《大模型 API 调用工程实践》系统拆解了一条完整的调用链路:业务入口 → Prompt 组装 → 模型网关 → 流式响应 → 重试限流 → 结构化返回,从 Demo 到生产级应用的核心知识点全覆盖。
《大模型结构化输出详解》深入拆解 JSON Schema、Function Calling、Tool Calling 与 MCP 的底层链路,结合 Java 后端示例讲清楚 Schema 设计、服务端校验、工具分发和安全治理。
有了调用链路和结构化输出基础,还有一个问题没有解决:怎么知道你的 AI 应用到底好不好?《AI 应用评测体系:从 Golden Set 构建到线上灰度闭环》系统拆解了评测的完整闭环:Golden Set 怎么构建、LLM-as-Judge 的三类偏差怎么管控、RAG 的检索指标和生成指标如何分段评测、Agent 轨迹准确率如何衡量、离线评测到线上灰度怎么串成一条发布流水线。
2. AI Agent 知识体系
AI Agent 是当下最热的方向,但网上的资料要么太浅要么太散,很难串起来。《一文搞懂 AI Agent 核心概念》把 Agent 从 2022 到 2025 年的六代进化史梳理了一遍,讲清楚 Agent 和传统编程、Workflow 的本质区别,以及 Agent Loop、Context Engineering、Tools 注册这些核心概念。
《AI Agent 记忆系统》深入讲解短期记忆与长期记忆的设计原理,涵盖记忆存储形式与功能分类、生命周期操作、主流技术架构对比及生产级工程优化策略。
《大模型提示词工程实践指南》覆盖了 Prompt 四要素框架(Role + Task + Context + Format)和六大核心技巧:角色扮演、思维链、少样本学习、任务分解、结构化输出、XML 标签与预填充。另外还讲了 Prompt 注入攻击原理和三层防护。
《上下文工程实战指南》讲的是 Context Engineering 和 Prompt Engineering 到底差在哪,以及静态规则编排、动态信息挂载、Token 预算降级三个核心技术。长任务的上下文持久化也覆盖了:Compaction、结构化笔记、Sub-agent 三种方案。
《AI 工作流中的 Workflow、Graph 与 Loop》拆解了为什么“把几个 Prompt 用 if-else 串起来”不够用——LLM 输出天然不确定,单次生成往往不达标,工具调用随时可能失败。文章讲清楚 Workflow、Graph、Loop 三个核心概念如何协作,覆盖 Node/Edge/State 设计原则、安全边界三要素,以及 Spring AI Alibaba 和 LangGraph 的完整代码实现。
3. RAG 检索增强生成
RAG 是企业级 AI 应用的核心技术,但很多开发者只停留在“把文档切块、转向量、检索”这个层面,背后的原理没搞懂。
- 《万字详解 RAG 基础概念》:RAG 是什么、为什么需要它、核心优势和局限性在哪
- 《万字详解 RAG 向量索引算法和向量数据库》:HNSW、IVFFLAT 等索引算法的原理,以及怎么选向量数据库
- 《万字详解 GraphRAG》:知识图谱驱动的 RAG,深入解析实体、关系、社区发现、全局检索与局部检索
- 《万字详解 RAG 检索优化》:Chunk 策略、Hybrid Search、Query Rewrite、Rerank、上下文压缩等实战优化
- 《RAG 文档处理与切分策略》:从文档解析、清洗、Chunking 到多模态内容处理的完整链路拆解
- 《RAG 知识库文档更新策略》:增量更新、版本控制、去重与全量重建的工程实践
4. MCP 协议与工具调用
AI 应用开发里,工具接入的碎片化一直是个老大难问题。MCP 协议就是来解决这个的。
《万字拆解 MCP 协议》讲了 MCP 为什么被称为“AI 领域的 USB-C 接口”,四大核心能力和四层分层架构,以及生产环境开发 MCP Server 的最佳实践。
《万字详解 Agent Skills》讲清楚 Skills 为什么是“延迟加载”的 sub-agent,它和 Prompt、MCP、Function Calling 的本质区别,以及实战中怎么设计一个优秀的 Skill。
《一文搞懂 Harness Engineering》拆解了 Agent = Model + Harness 这个等式——决定 Agent 天花板的是 Harness 而不是模型。文章覆盖了六层架构、上下文管理的 40% 阈值现象,以及 OpenAI、Anthropic、Stripe 等一线团队的工程化实战经验。
5. AI 应用系统设计
很多团队能把 Prompt Demo 跑起来,但上了生产才发现:同一个问题今天答对明天答偏;Token 账单飙升没人知道钱花在哪;出了事故,只能从一堆日志里猜模型当时看到了什么。分水岭就在这里——Prompt Demo 证明的是模型能回答,生产系统要证明的是系统能长期、稳定、可控地回答。
《AI 应用系统设计:从 Prompt Demo 到生产级架构》深入拆解生产必须面对的每个环节:Prompt 管理、模型网关、RAG、Memory、Tool 调用、异步任务、可观测性、评测闭环、安全合规,以及对应的 Java 后端落地方案。
AI 语音是另一个快速落地的方向,面试里也开始出现相关题目。《AI 语音技术详解:从 ASR、TTS 到实时语音 Agent 的工程化落地》拆解了语音系统的完整链路——音频采集、VAD、ASR、LLM、TTS、流式播放、打断处理,以及云端 API、本地模型、端云混合的真实选型逻辑。
6. AI 编程
面试里关于 AI 编程工具的问题越来越多:用过什么 AI 编程 IDE?Claude Code 和 Cursor 怎么选?AI 对后端开发者核心竞争力有什么影响?
Claude Code、Cursor、Codex 等工具的使用实战、面试准备与效率技巧,详见 AI 编程 专栏。
文章列表
面试题
- AI 应用开发面试指南 - AI 应用开发面试题总入口,按大模型基础、AI Agent、RAG、AI 系统设计组织复习路线
- 大模型基础面试题总结 - 系统整理大模型/LLM 高频面试题,覆盖 Token、上下文窗口、采样参数、API 调用、结构化输出、Function Calling、MCP 与 AI 应用评测
- AI Agent 面试题总结 - 系统整理 AI Agent 高频面试题,覆盖 Agent 核心概念、Memory、Prompt Engineering、Context Engineering、MCP、Agent Skills、Harness Engineering 与 AI 工作流
- RAG 面试题总结 - 系统整理 RAG 高频面试题,覆盖 RAG 基础、Embedding、向量数据库、Chunk 策略、文档处理、检索优化、GraphRAG、知识库更新与 RAG 评测
- AI 系统设计面试题总结 - 系统整理 AI 应用系统设计高频面试题,覆盖生产级架构、模型网关、Prompt 管理、可观测、评测、安全治理与实时语音 Agent
大模型基础
- 万字拆解 LLM 运行机制:Token、上下文与采样参数 - 深入剖析大模型底层原理,把 Token、上下文窗口、Temperature 等概念还原为清晰、可控的工程概念
- 大模型 API 调用工程实践:流式输出、重试、限流与结构化返回 - 系统拆解 AI 应用调用大模型 API 的生产链路,覆盖流式输出、重试、限流、结构化返回与 Java 后端落地
- 大模型结构化输出详解:JSON Schema、Function Calling 与工具调用 - 深入拆解 JSON Schema、Function Calling、Tool Calling 与 MCP 的底层链路,结合 Java 后端示例讲清楚 Schema 设计、服务端校验、工具分发和安全治理
- AI 应用评测体系:从 Golden Set 构建到线上灰度闭环 - 系统拆解 AI 应用评测完整闭环,覆盖 Golden Set 构建、LLM-as-Judge 偏差控制、RAG/Agent/结构化输出分领域指标体系、Trace 回放与 CI 自动回归落地
AI Agent
- 一文搞懂 AI Agent 核心概念 - 梳理 AI Agent 六代进化史,掌握 Agent Loop、Context Engineering、Tools 注册等核心概念
- AI Agent 记忆系统 - 深入理解短期记忆与长期记忆设计,掌握记忆存储形式、生命周期操作与生产级工程优化策略
- 大模型提示词工程实践指南 - 掌握 Prompt 四要素框架、六大核心技巧及企业级安全实践
- 上下文工程实战指南 - 深入理解 Context Engineering 核心概念,掌握静态规则编排、动态信息挂载、Token 预算降级等关键技术
- 万字详解 Agent Skills - 深入理解 Skills 的设计理念,掌握 Skills 与 Prompt、MCP、Function Calling 的本质区别
- 万字拆解 MCP 协议,附带工程实践 - 理解 MCP 协议的核心概念、架构设计和生产级最佳实践
- 一文搞懂 Harness Engineering:六层架构、上下文管理与一线团队实战 - 深度解析 Harness Engineering,拆解 OpenAI、Anthropic、Stripe 等一线团队的 Agent 工程化实战经验
- AI 工作流中的 Workflow、Graph 与 Loop:从概念到实现 - 深度解析 Workflow、Graph、Loop 三大核心概念,对比传统工作流与 AI 工作流的差异,覆盖 Spring AI Alibaba 和 LangGraph 完整代码实现
RAG(检索增强生成)
- 万字详解 RAG 基础概念 - 深入理解 RAG 的工作原理、核心优势和局限性
- 万字详解 RAG 向量索引算法和向量数据库 - 掌握 HNSW、IVFFLAT 等索引算法原理,学会选择合适的向量数据库
- 万字详解 GraphRAG - 深入理解知识图谱驱动的 RAG,掌握实体、关系、社区发现、全局检索与局部检索
- 万字详解 RAG 检索优化 - 掌握 Chunk 策略、Hybrid Search、Query Rewrite、Rerank、上下文压缩等实战优化
- RAG 文档处理与切分策略:从解析、清洗、Chunking 到多模态内容处理 - 深入解析 RAG 文档进入索引前的完整链路,涵盖文件解析、清洗、结构化、Chunking 策略与多模态内容处理
- RAG 知识库文档更新策略:增量更新、版本控制、去重与全量重建 - 深入解析 RAG 知识库更新的工程实践,涵盖增量更新、版本回滚、去重与灰度发布
AI 系统设计
- AI 应用系统设计:从 Prompt Demo 到生产级架构 - 覆盖 Prompt 管理、模型网关、RAG、Memory、Tool 调用、异步任务、可观测性、评测、安全合规等生产环节,拆解 Demo 和生产系统的本质差距
- AI 语音技术详解:从 ASR、TTS 到实时语音 Agent 的工程化落地 - 深入拆解语音系统完整链路,涵盖 VAD、ASR、TTS、流式播放、打断处理与端云混合选型
配图预览
每篇文章都画了大量配图,挑几张看看:
AI Agent 核心架构

Agent Loop 工作流程

Harness 和 Prompt/Context Engineering 的关系:

Agent 记忆分类全景图:
写在最后
专栏持续更新中。觉得有帮助就分享给朋友,有问题直接 issue 留言。


