AI 应用开发面试指南

持续更新中
这个专栏还在持续更新,后面会补更多高频面试考点。
想了解什么主题,或者发现内容有误,直接在项目 issue 区留言就行。
这个专栏能帮你解决什么问题?
很多开发者碰到的困境是:Agent、RAG、MCP 这些概念看了不少,但面试一问就卡壳,要么只知道概念说不清原理,要么知道原理但搭不出东西。
这个专栏就是冲着解决这个问题来的:把 AI 应用开发的核心知识拆透,让你面试能讲清楚,上手能做出来。
1. 扎实的大模型基础知识
做 Agent 工作流、调 RAG 检索,最容易踩坑的地方反而是最底层的 LLM 参数。比如:
- 为什么明明设置了温度为 0,结构化输出还是偶尔崩溃?
- 为什么往模型里塞了长文档后,它好像失忆了,忽略了 System Prompt 里的关键指令?
- Token 到底怎么算的?为什么中文和英文的消耗不一样?
这些问题,不搞懂 LLM 的底层原理就永远只能靠玄学调参。在《万字拆解 LLM 运行机制》中,我把 Token、上下文窗口、Temperature 这些概念还原成了清晰、可控的工程参数。
搞懂原理后,还需要知道怎么把这些模型调用落地到生产。《大模型 API 调用工程实践》系统拆解了一条完整的调用链路:业务入口 → Prompt 组装 → 模型网关 → 流式响应 → 重试限流 → 结构化返回,从 Demo 到生产级应用的核心知识点全覆盖。
《大模型结构化输出详解》深入拆解 JSON Schema、Function Calling、Tool Calling 与 MCP 的底层链路,结合 Java 后端示例讲清楚 Schema 设计、服务端校验、工具分发和安全治理。
有了调用链路和结构化输出基础,还有一个问题没有解决:怎么知道你的 AI 应用到底好不好?《AI 应用评测体系:从 Golden Set 构建到线上灰度闭环》系统拆解了评测的完整闭环:Golden Set 怎么构建、LLM-as-Judge 的三类偏差怎么管控、RAG 的检索指标和生成指标如何分段评测、Agent 轨迹准确率如何衡量、离线评测到线上灰度怎么串成一条发布流水线。
2. AI Agent 知识体系
AI Agent 是当下最热的方向,但网上的资料要么太浅要么太散,很难串起来。《一文搞懂 AI Agent 核心概念》把 Agent 从 2022 到 2025 年的六代进化史梳理了一遍,讲清楚 Agent 和传统编程、Workflow 的本质区别,以及 Agent Loop、Context Engineering、Tools 注册这些核心概念。
《AI Agent 记忆系统》深入讲解短期记忆与长期记忆的设计原理,涵盖记忆存储形式与功能分类、生命周期操作、主流技术架构对比及生产级工程优化策略。
《大模型提示词工程实践指南》覆盖了 Prompt 四要素框架(Role + Task + Context + Format)和六大核心技巧:角色扮演、思维链、少样本学习、任务分解、结构化输出、XML 标签与预填充。另外还讲了 Prompt 注入攻击原理和三层防护。
《上下文工程实战指南》讲的是 Context Engineering 和 Prompt Engineering 到底差在哪,以及静态规则编排、动态信息挂载、Token 预算降级三个核心技术。长任务的上下文持久化也覆盖了:Compaction、结构化笔记、Sub-agent 三种方案。
3. RAG 检索增强生成
RAG 是企业级 AI 应用的核心技术,但很多开发者只停留在”把文档切块、转向量、检索”这个层面,背后的原理没搞懂。
- 《万字详解 RAG 基础概念》:RAG 是什么、为什么需要它、核心优势和局限性在哪
- 《万字详解 RAG 向量索引算法和向量数据库》:HNSW、IVFFLAT 等索引算法的原理,以及怎么选向量数据库
- 《万字详解 GraphRAG》:知识图谱驱动的 RAG,深入解析实体、关系、社区发现、全局检索与局部检索
- 《万字详解 RAG 检索优化》:Chunk 策略、Hybrid Search、Query Rewrite、Rerank、上下文压缩等实战优化
- 《RAG 文档处理与切分策略》:从文档解析、清洗、Chunking 到多模态内容处理的完整链路拆解
- 《RAG 知识库文档更新策略》:增量更新、版本控制、去重与全量重建的工程实践
4. 工具与协议
AI 应用开发里,工具接入的碎片化一直是个老大难问题。MCP 协议就是来解决这个的。
《万字拆解 MCP 协议》讲了 MCP 为什么被称为”AI 领域的 USB-C 接口”,四大核心能力和四层分层架构,以及生产环境开发 MCP Server 的最佳实践。
《万字详解 Agent Skills》讲清楚 Skills 为什么是”延迟加载”的 sub-agent,它和 Prompt、MCP、Function Calling 的本质区别,以及实战中怎么设计一个优秀的 Skill。
《一文搞懂 Harness Engineering》拆解了 Agent = Model + Harness 这个等式——决定 Agent 天花板的是 Harness 而不是模型。文章覆盖了六层架构、上下文管理的 40% 阈值现象,以及 OpenAI、Anthropic、Stripe 等一线团队的工程化实战经验。
5. AI 编程面试准备
AI 编程工具正在改变开发者的工作方式,面试也开始问了:用过什么 AI 编程 IDE?怎么看 AI 对后端开发的影响?程序员的核心竞争力会变成什么?
AI 编程相关面试题详见 AI 编程 专栏。
6. AI 编程实战
光看概念不够,得亲手用过才知道边界在哪。这个系列都是真实场景的实战案例,详见 AI 编程实战 专栏。
7. AI 编程技巧
掌握工具的使用技巧能让 AI 编程效率翻倍。这个系列聚焦工具的使用方法和最佳实践,详见 AI 编程技巧 专栏。
文章列表
大模型基础
- 万字拆解 LLM 运行机制:Token、上下文与采样参数 - 深入剖析大模型底层原理,把 Token、上下文窗口、Temperature 等概念还原为清晰、可控的工程概念
- 大模型 API 调用工程实践:流式输出、重试、限流与结构化返回 - 系统拆解 AI 应用调用大模型 API 的生产链路,覆盖流式输出、重试、限流、结构化返回与 Java 后端落地
- 大模型结构化输出详解:JSON Schema、Function Calling 与工具调用 - 深入拆解 JSON Schema、Function Calling、Tool Calling 与 MCP 的底层链路,结合 Java 后端示例讲清楚 Schema 设计、服务端校验、工具分发和安全治理
- AI 应用评测体系:从 Golden Set 构建到线上灰度闭环 - 系统拆解 AI 应用评测完整闭环,覆盖 Golden Set 构建、LLM-as-Judge 偏差控制、RAG/Agent/结构化输出分领域指标体系、Trace 回放与 CI 自动回归落地
AI Agent
- 一文搞懂 AI Agent 核心概念 - 梳理 AI Agent 六代进化史,掌握 Agent Loop、Context Engineering、Tools 注册等核心概念
- AI Agent 记忆系统 - 深入理解短期记忆与长期记忆设计,掌握记忆存储形式、生命周期操作与生产级工程优化策略
- 大模型提示词工程实践指南 - 掌握 Prompt 四要素框架、六大核心技巧及企业级安全实践
- 上下文工程实战指南 - 深入理解 Context Engineering 核心概念,掌握静态规则编排、动态信息挂载、Token 预算降级等关键技术
- 万字详解 Agent Skills - 深入理解 Skills 的设计理念,掌握 Skills 与 Prompt、MCP、Function Calling 的本质区别
- 万字拆解 MCP 协议,附带工程实践 - 理解 MCP 协议的核心概念、架构设计和生产级最佳实践
- 一文搞懂 Harness Engineering:六层架构、上下文管理与一线团队实战 - 深度解析 Harness Engineering,拆解 OpenAI、Anthropic、Stripe 等一线团队的 Agent 工程化实战经验
RAG(检索增强生成)
- 万字详解 RAG 基础概念 - 深入理解 RAG 的工作原理、核心优势和局限性
- 万字详解 RAG 向量索引算法和向量数据库 - 掌握 HNSW、IVFFLAT 等索引算法原理,学会选择合适的向量数据库
- 万字详解 GraphRAG - 深入理解知识图谱驱动的 RAG,掌握实体、关系、社区发现、全局检索与局部检索
- 万字详解 RAG 检索优化 - 掌握 Chunk 策略、Hybrid Search、Query Rewrite、Rerank、上下文压缩等实战优化
- RAG 文档处理与切分策略:从解析、清洗、Chunking 到多模态内容处理 - 深入解析 RAG 文档进入索引前的完整链路,涵盖文件解析、清洗、结构化、Chunking 策略与多模态内容处理
- RAG 知识库文档更新策略:增量更新、版本控制、去重与全量重建 - 深入解析 RAG 知识库更新的工程实践,涵盖增量更新、版本回滚、去重与灰度发布
AI 编程实战
AI 编程实战系列已移至 AI 编程 专栏,包括 IDEA + Qoder 插件实战、Trae + MiniMax 实战、Claude Code 接入第三方模型实战等文章。
AI 编程技巧
AI 编程技巧系列已移至 AI 编程 专栏,包括 AI 编程必备 Skills 推荐、Claude Code 核心命令详解、Claude Code 使用指南等文章。
配图预览
每篇文章都画了大量配图,挑几张看看:
Prompt 六大核心技巧
上下文窗口组成

Harness 和 Prompt/Context Engineering 三者不是并列关系,而是嵌套关系。更重要的是,每一层解决的是完全不同的问题:

MCP 被称为“AI 领域的 USB-C 接口”,统一了 LLM 与外部工具的通信规范

写在最后
专栏持续更新中。觉得有帮助就分享给朋友,有问题直接 issue 留言。

