一句话版ReAct 像边想边干Plan-and-Execute 像先写方案再施工Self-Ask 像自己拆题Self-Reflection 像干完再复盘。先说一句大实话很多人聊 Agent聊到最后就剩一个词工具调用。但工具只是手脚。真正决定 Agent 好不好用的是脑子怎么转——也就是架构模式。2025 年被称作AI Agent 元年。斯坦福 2026 年 AI 指数报告指出Agent 已从实验室走向生产环境企业部署率同比翻了近两倍。但一个尴尬的现实是大多数团队选架构靠感觉跑通了就用跑不通就推倒重来。今天用大白话聊透四种常见模式ReAct、Plan-and-Execute、Self-Ask、Self-Reflection。不堆术语只讲它像什么、适合什么、坑在哪、实战里怎么组合。1. ReAct边想边干像现场指挥ReAct Reasoning推理 Acting行动你可以把它想象成遇到问题 → 想一步 → 做一步 → 看结果 → 再想下一步。比如问 Agent「北京今天适合出门吗」它可能会这样想得查天气 → 做调用天气 API → 看有雨 → 想还要看看空气质量 → 做查 AQI → 综合判断 → 答不太合适建议带伞。优点灵活适合动态、不确定的任务实现简单LangChain、AutoGPT 等主流框架默认支持能根据中间结果随时改方向不容易一条路走到黑缺点步骤一多就容易绕圈、重复调用工具长任务里前面想过的内容可能被后面忘掉缺乏全局规划Token 消耗偏高——每一步都要想 做 看三个动作适合什么问答、检索、轻量自动化、需要实时反馈的场景工具调用次数少≤5 步的简单任务不太适合什么步骤很多、要求严格顺序的大项目写长篇报告、多阶段开发、跨系统工作流2. Plan-and-Execute先画蓝图再开工Plan-and-Execute 先规划后执行更像项目经理接到任务 → 拆成 1、2、3、4 步 → 按步骤执行 → 必要时微调计划。还是北京适合出门吗它的做法完全不同先出计划① 查天气 → ② 查空气质量 → ③ 查用户行程 → ④ 综合给建议。然后按计划一条条执行而不是走一步想一步。优点长任务更稳不容易跑偏结构清晰调试方便哪步错了一眼能看出来可以并行执行部分步骤效率更高对用户来说它要干什么更透明体验更好缺点计划阶段可能想偏——第一步规划错了后面全白费对突发变化反应慢——得重新规划Re-plan 也要花钱实现成本比 ReAct 高Planner Executor 两套逻辑适合什么写报告、做调研、数据处理、多步骤工作流多文件代码生成、批量文档处理不太适合什么高度实时、环境变化特别快的任务实时交易、即时对话博弈3. Self-Ask自己给自己出题Self-Ask 把大问题拆成小问题自问自答核心不是先计划或边想边做而是大题我不会那我先问自己几个小题答完再拼成最终答案。比如「为什么最近 AI Agent 这么火」Agent 自己先追问五个子问题什么是 Agent和 ChatGPT 有啥区别2024–2025 有哪些标志性产品企业为什么愿意为它买单技术瓶颈在哪未来三年会怎么发展一个一个答完再合成一篇完整分析。优点特别擅长复杂、开放、需要多角度论证的问题检索和推理结合好——每个子问题可以单独查资料回答往往更全面不容易漏维度子问题之间相对独立便于并行处理缺点容易问太多子问题爆炸5 个变成 15 个又慢又贵子问题质量决定上限——问偏了答再好也没用合成阶段可能出现前后矛盾需要额外统一整理对简单问题有点杀鸡用牛刀适合什么行业分析、竞品对比、知识密集型问答、深度内容创作不太适合什么简单 factual 问题Python 怎么读 CSV直接答就行4. Self-Reflection干完再照镜子Self-Reflection 做完 → 自己挑毛病 → 改 → 再检查可以单独用也常和上面三种叠加先按 ReAct / Plan / Self-Ask 出结果 → 再问自己这答案靠谱吗哪里有问题→ 修正 → 必要时重跑。比如写一段代码第一版写出来 → 自检边界条件处理了吗有 bug 吗 → 发现漏了空值判断 → 改一版 → 再检OK交付。优点明显提升质量减少胡编、漏项、逻辑漏洞对代码、写作、分析这类有标准答案形态的任务特别有效可以做成固定环节用户感知是更靠谱了缺点慢至少多跑 1–2 轮 LLM贵Token 成本成倍涨反思也可能过度纠错——本来对的改错了没有好的评估标准时反思容易变成为了改而改适合什么代码生成、正式文档、高准确率需求的场景涉及合规、财务、法律等零容错的场景不太适合什么追求极致速度的场景答案本身没有明确对错的任务比如创意文案改来改去可能越改越没味一张表帮你快速选型模式一句话最大优点最大缺点典型场景ReAct边想边干灵活、好上手长任务易绕圈搜索、问答、轻量工具调用Plan-and-Execute先计划再执行长任务稳、可追踪计划错了全盘受影响报告、调研、多步骤流程Self-Ask自己拆小题复杂问题答得全子问题过多又慢又贵深度分析、开放性问题Self-Reflection做完再复盘质量明显提升慢、贵、可能过度改代码、正式输出、高准确率实战里怎么选别教条真实产品里很少只用一种。常见组合ReAct Reflection灵活干活最后质检一遍。很多 coding agent 接近这种——先写出代码再自检修复。Plan-and-Execute Reflection大项目先拆步每步或整体再复盘。适合正式报告、合规文档生成。Self-Ask ReAct复杂问题先拆题每个子问题用 ReAct 查和答。适合深度调研。Plan Self-Ask先粗规划某几步再细拆子问题。大型分析项目常用。行业实践中有一种更通用的模式——混合架构Hybrid系统先判断任务复杂度简单任务走 ReAct 快速通道复杂任务切 Plan-Exec 模式关键步骤加 Reflection 校验。这是目前生产环境 Agent 的主流做法。选型记三句话就够了任务短、变化快 → 优先ReAct步骤多、要可控 → 优先Plan-and-Execute问题大、要挖深 → 加Self-Ask不能错、要交付质量 → 加Self-Reflection动手建议别一上来就追最炫的很多团队踩过的坑一上来就搞混合架构 多模型调度 动态路由结果调试两周还没跑通一个简单场景。上手顺序建议业界共识先做 ReAct串通思考 → 行动 → 观察闭环实现一个可调用工具的极简 Agent。这是所有模式的地基。再学 Plan-Exec理解任务分解处理明显多阶段的复杂需求。引入 Reflection给自己加个质检环节感受质量提升和成本增加之间的权衡。最后走混合模式加入动态路由、状态管理、日志监控、失败降级。到这一步你已经不是在做 demo 了是在做产品。架构是手段不是目的。用户要的是快、准、稳、省钱——这四个里你最多同时满足三个得根据业务做取舍。结尾你平时用的 AI 产品更像哪一种A问一句答一句偏 ReActB先列计划再一步步做偏 PlanC会拆成很多小问题偏 Self-AskD会自我检查、改稿偏 Reflection评论区聊聊或者转发给正在做 Agent 的朋友——选对脑子比堆工具重要。本文参考斯坦福 2026 AI 指数报告、LangChain/LlamaIndex 架构文档、技术栈社区 AI Agent 架构设计与实践系列。