面试官问我:“什么时候微调、什么时候RAG?”,我:“模型效果不好,需要判断是因为它‘不知道‘,还是因为它‘做不好‘,面试官不断点头
现实里项目一开始你面对的根本不是怎么微调。而是这个问题这个需求到底该上 RAG还是该微调这是大模型应用开发里最高频的架构选型题也是面试官最爱问的一道。“你这个项目为什么用 RAG不用微调”“反过来为什么微调不用 RAG”“什么时候两个都要用”答不上来前面 SFT、LoRA 背得再熟也白搭——因为你连第一步选型都没想清楚。这篇我们就把这个框架建起来。一、先破一个最常见的误解微调 ≠ 给模型加知识绝大多数人第一次纠结微调还是 RAG都是从一个错误前提出发的“模型不知道我们公司的业务那我微调一下让它把这些知识记住不就行了”这个理解是错的而且错得很彻底。微调改的从来不是模型知道什么而是模型怎么做。我们之前在 SFT 那一篇 反复强调过一句话微调更常见的价值不是补知识而是控行为。你想让模型输出固定的 JSON 格式、想让它用客服那种语气说话、想让它在医疗/法律场景里有更专业的判断风格——这些是行为微调能搞定。但你想让它知道公司这周刚改的退款政策、“这个客户签了哪几条合同”——这些是知识而且是会变的、私有的、要追溯来源的知识。这种东西硬塞进参数里是灾难知识一变就得重训政策周一改了你周二就得重新训一遍模型答错了无法追溯模型张口就来你不知道它依据的是哪份文档还容易引发灾难性遗忘为了记住新知识反而把原来会的搞忘了补这种知识是 RAG 的活儿。我们在 为什么有了大模型还需要 RAG 里讲过它解决的正是这四个问题幻觉、私有知识、时效性、可追溯。所以微调和 RAG 的本质区别一张图就能说清微调改变模型参数RAG不改参数只外挂知识的对比示意图这张图回答的是微调和 RAG 到底动了模型的什么。看那一格格的方块它代表模型的参数权重。左边 RAG那些格子从头到尾全是灰的、一格没变——模型参数全程冻结。它只是在运行时去知识库里检索把查到的内容喂进输入知识根本不进权重。所以知识改了改文档就行模型不用重训。右边微调格子有几个变成了蓝色——参数被实打实地改写了行为焊进了权重。好处是稳定、不占上下文代价是知识一变就得重训。记住这条主线下面所有判断都从它推出来缺知识找 RAG缺行为才考虑微调。二、一句话判断你缺的是知识还是行为很多复杂的选型题其实一句话就能切开先问自己——现在效果不好是因为模型不知道还是因为模型做不好模型不知道是知识问题它答不出公司内部文档里的内容它说的产品信息是半年前的旧版本它编造了一个根本不存在的条款这些RAG。模型做不好是行为问题输出格式忽对忽错没法被代码稳定解析语气不对太官方或者太随意在你的专业领域里判断风格不够地道这些微调很多时候甚至 Prompt 就够后面会讲。举个最容易混的例子。你想做一个法律合同审查助手效果不好。到底该 RAG 还是微调得拆开看如果是它不知道最新的法律条文、不知道这家公司的历史合同 → 这是知识问题 → RAG如果是它知道条文但审查报告写得乱七八糟、不像专业律师那个风格 → 这是行为问题 → 微调同一个项目不同的痛点答案完全相反。所以选型的第一步永远是先定位问题而不是先选方案。三、四个维度把选型量化下来“知识 vs 行为”能解决大部分判断。但面试官往往要你说得更细——具体从哪几个维度权衡给录友四个维度对着打分就行维度倾向 RAG倾向 微调数据量知识量大、文档海量塞不进上下文有几百到几千条高质量、带标注的示范数据任务类型缺的是事实知识模型“不知道”缺的是行为能力风格 / 格式 / 语气 / 专业度更新频率知识经常变改一次就要马上生效行为稳定不会三天两头改成本起步快改文档即可、无需训练数据 训练 评估一次性投入更高四个维度分别往哪边倒挨个说。1. 数据量你手里是海量文档还是高质量示范知识量大、文档海量、根本塞不进上下文→ RAG。几千份文档你不可能训进参数也不可能全塞进 Prompt只能检索。有几百到几千条高质量、带标注的示范数据→ 微调。微调吃的不是文档是输入→理想输出的成对示范。注意这里的关键词微调要的是示范不是资料。你有 10 万字产品手册那是资料喂给 RAG。你有 800 条用户这么问、客服该这么答的对话那是示范可以拿来微调。2. 任务类型补事实还是改能力这就是上一节知识 vs 行为的展开。任务是补充事实知识问答、查资料、找依据→ RAG任务是改变行为能力固定格式、特定语气、专业判断、复杂指令遵循→ 微调一个判断小技巧如果答案对不对取决于有没有查到正确资料那是 RAG 的活如果答案好不好取决于表达方式和专业度那才轮到微调。3. 更新频率知识多久变一次这个维度最容易被忽略但它常常是压垮微调灌知识方案的最后一根稻草。知识经常变、改一次就得马上生效→ RAG。改知识库里的文档下一次检索立刻生效秒级更新。行为稳定、不会三天两头改→ 微调才划算。你不会每周改一次客服该用什么语气。想象一下用微调把价格表训进模型结果运营每天调价。你每天重训一遍模型光想想就知道这条路走不通。凡是高频更新的东西天然属于 RAG不属于参数。4. 成本一次性投入 vs 长期维护RAG 起步快搭好检索链路之后改知识就是改文档几乎零额外训练成本。微调前期重要准备标注数据、要训练、要评估还要考虑模型迭代后的重训维护。别只算训练那一下的钱。微调真正的成本在长期维护基座模型升级了要不要跟着重训数据漂移了要不要补训这些都是持续投入。四个维度看下来你会发现一个规律**它们其实指向同一个判断——你缺的到底是知识还是行为。**数据量、更新频率、成本都是在帮你确认这件事而不是四个独立的投票项。四、选型决策流程先 Prompt再 RAG最后才微调定位完问题还有一个顺序问题。很多录友一遇到效果不好第一反应就是上微调。这是新手最典型的毛病一上来就掏最重的武器。正确的顺序是按成本从低到高试先Prompt再RAG最后才微调的选型决策流程图这张图回答的是拿到一个不达标的需求该按什么顺序决策。**第一步缺什么先定位。**是缺知识、缺行为还是两样都缺。缺知识→ RAG。可更新、可追溯不用动模型。两样都缺→ RAG 微调一起上下一节细讲。缺行为→ 先别急着微调再问一句Prompt / few-shot 能不能调好能→ 就用 Prompt。改个提示词、给两个示例就能解决的事犯不上训模型。很多格式不稳的问题其实 结构化输出 JSON Schema 就治好了。不能且手里有示范数据→ 这才轮到微调。记住这条成本线Prompt RAG 微调。能用 Prompt 解决的不上 RAG能用 RAG 解决的不上微调。为什么强调这个顺序因为微调是这三者里最贵、最难维护、最容易翻车的一个。它该是你试过前两步都不行之后的选择而不是第一选择。面试时你要是能主动说出我会先评估 Prompt 和 RAG 能不能解决确实不行才考虑微调面试官立刻知道你是干过活的不是只会背名词。五、真相现实里常常是 RAG 微调一起上讲到这你可能以为这是道单选题。不是。真实的复杂系统往往两个都要。因为前面反复说的那条主线RAG 管知识微调管行为。一个系统完全可能既要新知识又要稳行为。这时候就别二选一了让它们各管各的RAG提供实时知识微调对齐行为的混合架构示意图这张图回答的是两者怎么配合在一条链路里。用户问题进来RAG 负责知识线去知识库检索最新、最准的资料拼进 context。这条线保证内容是新的、可追溯的。微调负责行为线处理这些 context 的是一个已经被微调对齐过的模型它懂这个领域该用什么格式、什么语气、什么专业判断。这条线保证输出是稳的、地道的。最后出来的答案内容是新的RAG 给的格式是稳的微调给的。举个具体场景。一个金融领域的智能投顾助手行情、政策、产品信息每天在变 → 这部分靠RAG实时检索但回答必须符合合规话术、专业风格、固定的风险提示格式 → 这部分靠微调焊进模型行为你单用 RAG知识够新但话术不专业、格式不合规你单用微调话术专业但知识永远停在训练那天。两条线各管各的才是成熟系统的样子。六、几个典型场景对号入座光讲框架太虚给录友几个高频场景直接套企业内部文档问答几千份手册、规范、合同知识为主、海量、常更新 →纯 RAG客服话术固定、输出格式严格知识不多但行为要稳先试Prompt搞不定再微调垂直领域专业助手 实时数据法律/医疗/金融既要专业行为又要新知识 →RAG 微调代码/文案风格统一要模型学会某种固定风格知识需求低微调或 LoRA 多适配器参考 LoRA 篇 讲的一基座多适配器只是偶尔答不准、格式偶尔崩问题不严重大概率Prompt 优化就够别动不动就训模型你会发现**真正非微调不可的场景比想象中少得多。**大量需求 Prompt RAG 就解决了。这也是为什么我一直跟录友说别一遇到问题就想着微调那往往是想偏了。七、面试怎么答如果面试官问“你这个项目为什么用 RAG 不用微调”或者“什么时候该微调什么时候该 RAG”可以这样答“我判断的核心是先定位问题模型效果不好是因为它’不知道’还是因为它’做不好’。如果是缺知识——比如要回答公司内部文档、实时数据、要能追溯来源——我用 RAG。因为这类知识量大、会变、还要可追溯硬训进参数代价太高改一次就得重训还可能引发灾难性遗忘。RAG 改文档就能秒级更新。如果是缺行为——比如要固定输出格式、特定语气、专业判断风格——我会先看 Prompt 和 few-shot 能不能解决因为它最便宜。Prompt 搞不定、又有高质量示范数据才上微调把行为对齐进模型。具体我会从四个维度权衡数据量是海量文档还是少量高质量示范任务是补事实还是改行为知识更新频率高不高以及一次性和长期维护的成本。成本上我的优先级是 Prompt RAG 微调能用前面的解决就不上后面的。很多复杂项目其实是 RAG 微调一起用RAG 管实时知识微调管稳定行为两条线各管各的。比如我这个项目就是……”然后接你自己的项目细节。这个回答能体现四件事第一你懂微调和 RAG 的本质区别改参数 vs 不改参数行为 vs 知识。第二你有量化的判断维度不是拍脑袋。第三你懂成本意识先 Prompt 再 RAG 最后微调。第四你知道现实是混合架构不是单选题。比一句我们用了 RAG或者我们做了微调强太多。八、最后选型这道题难的从来不是知道 RAG 和微调各是什么。难的是遇到具体需求时你能不能一眼看穿——它缺的到底是知识还是行为。这一句想清楚了剩下的都是顺水推舟缺知识RAG。缺行为先 Prompt不行再微调。两样都缺一起上。别再一遇到问题就喊微调了。最贵的方案应该是你最后的选择不是第一反应。学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】