大多数人使用 Claude Code 的方式是这样的输入一个需求看着它工作几分钟读完结果后再输入下一个请求。他们是提示者——代理像一把功能强大的工具只有被“戳”一下才会动。循环设计师构建的却是另一套东西一个能自我提示的系统。它按定时器启动对照明确目标检查自己的输出在需要时调用辅助代理最后把学到的东西写下来让下一次运行直接站在更高起点上。设计师大部分时间并不坐在屏幕前操作他们只是构建了那个会自己坐在屏幕前工作的系统。这个差距既不是天赋问题也不是“再写一个更好提示词”就能解决的。它是十个具体、可落地的步骤。模型本身没有变变的是你给它套上的整个运行环境。把代理重新定义为带计时器的循环把代理看成聊天窗口和把它看成一个while 循环完全是两种思维。循环的本质就一句话不再由你来发送下一个提示而是系统自己发送。它运行代理 → 对照目标检查结果 → 如果没完成就再跑一次。整个过程可以用极简逻辑描述是否定时器触发加载状态文件 技能执行代理 Maker独立验证器 Checker 检查是否达到目标?更新状态文件蒸馏通用技能结束本轮 / 进入下一轮这个重构是整个思维切换的起点。提示者优化的是单条消息循环设计师优化的是启动条件、停止条件、跨轮记忆这三个循环要素。一旦你把代理看成循环后续所有工作都变成了对这三个要素的塑造。先把运行环境Harness建稳否则循环只会把垃圾放大再聪明的循环也只能在它运行的环境里发挥作用。这个环境包括模型、可用工具、工具权限、每次启动时读取的上下文。很多人直接把一个脆弱的手动流程包进循环结果就是更快地生产低质量输出。正确的顺序永远是反过来的先用人工把一次完整运行跑通、验证可靠再把这个稳定版本包装成循环。具体做法包括准备好CLAUDE.md存放项目恒定事实、明确验证目标、接好必要工具。只有把这些先固化循环每一次迭代才会复用高质量基础而不是把早期漏洞乘以运行次数。自改进的从来不是模型而是围绕模型的环境“自改进代理”这个说法很容易让人误解。模型的权重在你的每次运行之间不会改变。它不会因为跑了 50 次就突然变聪明。真正变聪明的是系统它积累的记忆、针对边缘案例打磨出的技能、以及那个始终保持独立的验证器。把工作重心放在模型外部的环境建设上而不是期待模型自己进化这才是可持续的路径。给循环一个独立的目标和验证器循环需要一个明确的停止条件而不是“代理觉得自己做完了”。/goal命令就是用来定义这个客观目标的。更关键的是独立性决定“是否完成”的那个东西不能是完成工作的那个东西。制造者Maker带着自己写过的上下文天然倾向于为自己的输出辩护验证器Checker用全新上下文窗口只看到最终产物和标准没有既得利益。这种分离不是为了省事而是结构性的正确性保障。一个没有独立验证器的循环本质上是在更快地生产“自信的错误”。分离制造者与检查者 定时器 云端部署把验证器做成子代理后循环就有了明确的“制造-检查”双轨。接下来是让它自己跑起来用/loop把任务放到定时器上让代理持续啃 backlog 而不是等你手动触发再把整个配置迁移到云端例程Anthropic 托管基础设施关掉电脑它依然在工作。定时器把单次运行变成习惯云端把习惯变成基础设施。对于更复杂的任务Claude Code 可以让你用自然语言描述需求它自动把已定义的子代理组合成工作流。常见的三种有效形态是扇出-合成并行拆分后汇总、对抗验证每任务配独立检查器、以及带停止条件的循环。工作流再强也依赖前期打好的 harness 和子代理质量。让循环真正产生复利记忆、技能与安全闭环到这里循环已经能持续运行但还不能“变聪明”。关键是给它记忆。代理本身每次运行都会遗忘。循环不需要。状态文件记录本次尝试了什么、什么有效、什么失败、最终沉淀了哪些规则。每次运行开始时先读取它结束时再更新它。跳过任意一步明天就从零重来。更进一步把项目特定的经验蒸馏成通用技能。状态文件是项目记忆会随项目结束而消失技能则是跨项目可复用的程序化能力。循环每一次撞墙都把教训写入技能库后续所有项目都能继承。最后是安全闭环。无人值守的循环必须 fail-safe。护栏guardrails就是模型无法绕过的硬墙路由高成本任务到重型模型、把高频任务交给更便宜模型、为无法处理的任务设置回退路径。一个能被放心放手的循环必须在权限和不可逆操作上都有明确边界。提示者与循环设计师的决策对比维度提示者手动模式循环设计师系统模式触发方式人工输入每一条请求定时器 / 事件驱动系统自治验证机制代理自我审查独立验证器全新上下文窗口状态管理每次从零开始状态文件持久化 技能蒸馏模型使用每次都用顶级模型按任务复杂度路由模型 成本控制演进路径每次重新探索跨运行积累系统持续变聪明风险控制依赖人工盯梢护栏 明确停止条件 不可逆操作拦截长期价值单次任务完成可复用的基础设施资产这些错误会让循环止步于“看起来在工作”把薄弱的 harness 直接循环化 → 只会更快地放大垃圾让制造者自己当检查者 → 得到的是自信的错误而不是正确的结论没有独立可验证的目标 → 循环停在“差不多就行”缺少状态文件 → 每一次运行都在重复昨天的错误经验只留在项目状态文件里 → 技能无法跨项目复用无人值守却给与宽松权限 → 风险随运行次数线性增长所有步骤都用顶级模型 → 成本在无人值守时持续失血。从操作工具到设计基础设施提示者手里有一把强大的工具需要自己时刻操作循环设计师构建的则是一套能自己运转的系统只在定义目标、设定标准、处理不可逆决策时才需要人介入。从前者到后者的转变不是学会某个秘密提示词而是一条清晰的序列先把代理看成循环 → 稳固它运行的环境 → 给它独立目标和诚实的验证器 → 加上定时器 → 再让它学会记住和蒸馏经验。模型始终是同一个真正变强的是你给它套上的那个循环。在你下一个代理项目里先补上目前最缺的那一块——可能是独立验证器也可能是状态文件或者一个最基础的安全护栏。从今天开始做起然后再做下一步。别再只优化提示词了开始设计循环吧。你目前在构建 AI 代理时最缺失的是独立验证器还是持久记忆机制欢迎在评论区分享你的具体场景和尝试。我是紫微AI在做一个「人格操作系统ZPF」。后面会持续分享AI Agent和系统实验。感兴趣可以关注我们下期见。