大模型思维链(CoT)理论梳理
目录一、什么是思维链二、用来干什么三、发展脉络四、如何开启推理4.1 普通模型提示词工程4.2 推理模型默认开启不可关闭4.3 当代模型可开关的思考模式五、总结一、什么是思维链一句话总结思维链Chain of ThoughtCoT它是一种提示工程技术——引导大模型在给出最终答案之前先输出一系列中间推理步骤。是由Goolge在2022年1月提出的思维链并没有给大模型增加任何新功能而是激活大模型本来就有的潜能不让其跳过中间推理步骤而是将输出的推理过程作为新的推理前文逐步逼近答案。类比做数学题是直接给出答案还是一步步写出中间过程最后算出答案肯定是后者的正确率高二、用来干什么核心用途是提升大模型在需要多步推理的复杂任务上的表现。具体来说分解复杂任务模型将复杂问题拆解为更小、更易于管理的子任务依次解决。减少推理错误分步推导降低了“一步到位”时常见的逻辑跳跃错误。提高可解释性用户可以看到模型的推理逻辑便于调试和建立信任。便于纠错当中间步骤出错时可以精准定位问题所在而不是面对一个“黑箱答案”无从下手。三、发展脉络2022年 发现思维链的存在利用提示词工程激活思维链2024年 推理模型兴起通过大规模强化学习将思维链能力内化到模型内部模型强制自动推理不需要提示词激活。代表模型DeepSeek R12026年推理能力思考模式”已是一项内置的核心功能模型不再强制推理可以选择是否开启推理以及推理强度。代表模型deepseek-v4-pro甚至有的模型可以自动决定是否开启思考模式(自适应思考)代表模型caude 4.8 和 chatGpt 5.5四、如何开启推理4.1 普通模型提示词工程推理能力完全依赖提示词工程来激活代表模型deepseek-v3本地部署轻量模型等开启方式零样本思维链Zero-Shot CoT 在问题后直接添加触发短语如“让我们一步步思考“”。模型会据此输出推理步骤。少样本思维链Few-Shot CoT 在提示中提供2-8个带有完整推理步骤的示例让模型模仿。思考内容的存放位置没有独立的“思考”字段。模型输出的推理过程和最终答案全部混在 content 字段中4.2 推理模型默认开启不可关闭模型将推理能力内置强制推理无需提示词唤醒。代表模型deepseek-r1思考内容的存放位置推理模型将思维链推理过程和最终答案分开存放通过两个独立的字段返回。字段内容reasoning_content思维链——模型的内部推理过程content最终答案reasoningresponse.choices[0].message.reasoning_content answerresponse.choices[0].message.content4.3 当代模型可开关的思考模式模型同时具备“直接回答”和“深度思考”两种模式通过API参数动态切换。代表模型DeepSeek V4 Pro、GPT-5系列开启方式通过 thinking.type 等参数控制思考模式的开关fromopenaiimportOpenAI clientOpenAI(api_key你的API Key,base_urlhttps://api.deepseek.com)responseclient.chat.completions.create(modeldeepseek-v4-pro,messages[{role:user,content:9.11和9.8哪个更大}],# 开启思考模式必须放在 extra_body 中extra_body{thinking:{type:enabled}},# 或 disabled 关闭# 可选控制思考强度reasoning_efforthigh# 可选 high / max)思考强度控制当代模型还支持通过 reasoning_effort 参数控制思考的“深度”参数值含义minimal / low轻量思考响应快Token少medium中等思考默认high / max深度思考准确性高耗时和Token更多思考内容的存放位置与推理模型一致思维链通过 reasoning_content 返回最终答案通过 content 返回五、总结维度普通模型推理模型当代模型代表模型GPT-4、Claude 3DeepSeek R1、OpenAI o1DeepSeek V4 Pro、Claude 3.7、GPT-5推理开启方式提示词引导默认开启不可关闭thinking.type 开关控制思考强度控制无无reasoning_effort 参数思考内容字段混在 content 中reasoning_contentreasoning_content是否可关闭不开启就没有不可关闭可关闭从普通模型到当代模型我们看到一条清晰的演进路径推理从“提示词技巧”进化为“内置默认行为”再进化为“可精细调控的开关” 。不变的是无论哪种方式思维链的本质都是让模型不跳过中间的推理过程——只是实现方式越来越优雅、越来越可控。