RAG 是 AI 应用开发里最容易被低估的模块。
很多人以为 RAG 就是“文档切块 -> 转向量 -> 存向量库 -> 检索 -> 拼 Prompt”。Demo 阶段这么理解没问题,但一到真实业务,问题马上变复杂:文档解析不干净、Chunk 切碎了语义、Embedding 模型选错、召回结果不准、权限过滤漏了、知识库更新后旧版本还在、模型拿到证据却没有正确回答。
所以,RAG 面试真正考的不是“你会不会接向量数据库”,而是:你能不能把一个检索增强生成系统拆成可定位、可优化、可评测、可更新的工程链路。
2026/5/18大约 14 分钟
