很多同学准备大模型面试时,第一反应是去背 Transformer、Attention、RLHF 这些词。不是说这些不重要,但对大部分后端转 AI 应用开发、AI 工程应用岗位来说,面试官更关心的是另一件事:
你是不是真的理解大模型调用链路里的工程约束。
比如 Token 为什么会影响成本和延迟?上下文窗口为什么不是越大越好?Temperature 为什么会影响结构化输出稳定性?Function Calling 为什么不能让模型直接执行真实业务操作?这些问题看起来基础,答不好就会暴露一个信号:你可能只是调过 API,还没有把大模型当作生产系统里的一个不稳定外部依赖来治理。
2026/5/18大约 11 分钟
