Loop Engineering 实战/goal 命令让 AI 自己写完整项目导读适合正在用或想尝试 Claude Code 的程序员。读完你会知道 Loop Engineering 到底是什么、/goal 和 /loop 怎么用、怎么把普通提示词改造成自动循环以及踩坑避雷经验。AI 编程圈又出新概念了——这次叫 Loop Engineering 循环工程。起因是 Claude Code 之父 Boris Cherny 在最新访谈里说了一段话我不再提示 Claude 了。我有一堆循环在运行它们才是在提示 Claude 并判断接下来该做什么。我的工作变成了写循环。Boris Cherny 预测编程史的下一次跃迁Loop 时代来了紧接着 OpenAI 的 Peter SteinbergerOpenClaw 之父 也公开表示你不该再给编程 Agent 写提示词了应该设计一套循环机制让这些循环去提示你的 Agent。两家顶级 AI 公司的核心人物同时在说一件事AI 编程的范式要升级了从手动写提示词变成设计循环系统。说实话我第一反应也是「又来Harness Engineering 还没学完呢」。但上周三晚上我在 Claude Code 里敲了一行/goal命令然后去洗澡回来发现 AI 已经自己建好了项目结构、写完了数据库 Schema、搭了 4 个页面还自己跑通了构建验证。整个过程我一个字没打。体验完之后我不得不说这玩意儿是真的有用。这篇文章我就把 Loop Engineering 从头给你讲明白——它是什么、跟之前那堆 Engineering 有什么关系、Claude Code 里怎么用、怎么把你现在的提示词升级成 Loop。跟着敲一遍就能上手。一、Loop Engineering 到底是什么Loop Engineering循环工程一种 AI 编程范式你设计一套自动运转的循环系统代替你去给 AI 下达指令、检查输出、记录进度、决定下一步做什么不断循环直到达成目标。你可以理解为「给 AI 装上自动驾驶系统」。第一次听可能有点抽象拿开车打比方就清楚了。Loop Engineering 像一个自动导航系统。以前你得盯着地图在每个路口告诉 AI「前面左转」「下一个出口下高速」。现在你只需要输入目的地导航自己规划路线——堵车了自己绕、走错了自动重新算路、到了目的地语音提醒你。你手不用离开方向盘但脑子已经不用一直想着怎么走了。你从「一步一步指挥 AI」的操作者变成了「定方向 最后验收」的监督者。上图就是 Loop 的基本骨架。不是让 AI 随便跑而是一个严格的「执行 → 验证 → 反馈 → 决策」闭环。Loop 的 3 个核心要素一个真正能用的 Loop需要三样东西1可验证的停止条件你得告诉 Loop 什么时候算完成而且这个标准必须能被自动验证。比如「npm run build 通过」「所有测试绿了」「lint 零报错」——这些都是好条件。而「把代码优化一下」就不行没人知道什么叫优化好了。2反馈闭环每轮循环结束后Loop 得自己检查这轮结果判断继续跑还是停下。最常见的形式写完代码自动跑测试没过就自己修修完再跑通了才停。3状态记忆AI 的对话窗口有长度限制关了就没。Loop 需要一个外部文件比如 PROGRESS.md记录当前进度——哪些做完了、哪些还在做、上一轮出了什么错。中间断了重启不会从零开始。两张图一对比就很清楚。传统模式是「人 → AI → 人等 AI → 人再推」Loop 是「人定目标 → AI 自己跑 → 人验收」。可能有人会问Loop 不就是个 while 循环吗写个脚本让 AI 反复执行不就行了不是。没有判断能力的循环AI 可能把错误当正确答案继续跑越跑越偏。Loop Engineering 和 cron 定时脚本的本质区别就在于那个反馈闭环——它能自己判断这轮做得好不好不好就换策略不是无脑重试。二、AI 编程是怎么一步步走到 Loop 的Loop 不是突然冒出来的它是从前几代方法论一层层长出来的。了解这条进化线你才知道 Loop 到底解决了什么问题、为什么现在才出现。1、提示词工程 Prompt Engineering20222024核心问题是 AI 经常答非所问。解法是研究怎么通过对话让 AI 听懂你——设定角色、约束输出格式、用思维链让它逐步推理。这个阶段你大部分精力花在打磨那几段提示词上。2、上下文工程 Context Engineering2025提示词写好了但 AI 不了解你的项目给的回答常常脱离实际。上下文工程解决的就是这个——在对的时候把对的信息喂给 AI。比如写 CLAUDE.md 规则文件、用 RAG 检索项目文档、建立跨会话记忆。AI 的输出开始贴合你的实际场景了。3、驾驭工程 Harness Engineering2026 年初AI 能理解项目了但产出不稳定——有时候写得好有时候跑偏。Harness 的思路是给 AI 搭一整套靠谱的工作环境配好工具链、写好测试、定好架构约束、拆好任务。相当于你给 AI 修了一条跑道它在这条跑道上不容易翻车。4、循环工程 Loop Engineering2026 年中前面三步都做好了AI 已经能在靠谱的环境里干活了。但你还是得一步步推着它走——写完这一步你看了觉得 OK再告诉它下一步干什么。Loop 解决的就是这个——把「提示、检查、决定下一步」交给一套自动循环系统你只设定目标和停止条件然后等着验收。这四层不是替代关系是层层叠加的。提示词技巧、上下文管理、Harness 搭建在 Loop 里全都要用。Loop 只是在最上面多了一层「自动循环 反馈闭环」。很多人搞不清 Harness 和 Loop 的区别我拿工厂流水线打个比方。Harness 相当于你建了一条生产线每个工位配好了工具和质检标准然后你站在产线旁边盯着——哪个环节卡住了你过去疏通哪个零件不合格你挑出来。产线跑起来了但离不开你的实时指挥。Loop 是你把整条产线的流程写成程序设定好质检规则和异常处理逻辑按下启动键就走了。机器自己投料、加工、质检不合格的自动回炉重做产线卡住了自动报警。你从产线管理员变成了工厂设计师。阶段核心问题你做什么典型手段Prompt EngineeringAI 答非所问写更好的提示词角色设定、思维链Context Engineering回答脱离实际喂项目背景CLAUDE.md、RAGHarness Engineering产出不稳定搭工作环境工具链、测试、规范Loop Engineering需要人推着走设计自动循环/goal、/loop、PROGRESS.md三、Claude Code 里的两种循环2026 年 6 月实测/goal 需要 Claude Code v2.1.139 或更高版本/loop 适用于 v2.0Claude Code 目前内置了两个 Loop 命令分别对应不同场景。第一次用容易搞混这里说清楚。/goal —— 跑到完成为止/goal的机制你给出一个目标 可验证的完成条件AI 开始工作。每一轮结束后有一个独立的判断模型来检查「目标达成了没」。没达成就自动下一轮达成就停止并报告。注意判断目标的和执行任务的是两个模型避免了自己改自己卷子的偏差。/goal 从零搭建 AI 开发日志项目包含前端页面和 SQLite 数据库直到npmrun build 通过且 dev server 能正常访问所有页面加熔断限制防止跑飞/goal 修复项目里所有 TypeScript 类型错误直到 tsc--noEmit零报错。最多跑20轮超了自动停止/loop —— 定时反复跑/loop按固定时间间隔执行操作/loop 5m 检查项目前后端的部署状态如果有报错就通知我维度/goal/loop运行方式跑到目标达成为止按固定时间间隔重复适合场景有明确终点的一次性任务没有明确终点的持续监控验证机制独立判断模型检查目标每轮执行后等下一轮触发停止方式目标达成 / 熔断触发手动停止典型用例从零搭项目、批量重构等部署、监控报错、定时扫描四、实战用 /goal 从零搭建「AI 开发日志」项目概念和命令讲完了直接上手。项目是什么做一个叫「AI 开发日志」的全栈小项目功能很简单记录每次 AI 编程会话的内容、Token 消耗、产出代码量仪表盘页面展示本周统计历史记录列表支持搜索和筛选技术栈Next.js 14 SQLitebetter-sqlite3 Tailwind CSS。设定目标在 Claude Code 工作目录下输入/goal 从零搭建AI 开发日志全栈项目。 技术栈Next.js14(App Router) TypeScript Tailwind CSS better-sqlite3。 功能要求1. 首页仪表盘展示本周 AI 会话次数、总 Token 消耗、代码产出量2. 历史页所有会话记录列表支持按日期搜索和按项目筛选3. 新增页表单填写会话内容、Token 数、代码行数、项目名4. API 路由/api/sessions 支持 GET 和 POST 停止条件npm run build 无报错npm run dev 能正常启动浏览器访问首页、历史页、新增页均能正常渲染。 每完成一个模块就跑一次构建验证有报错自己修修完再继续。同一问题修复超过5次就记录到 PROGRESS.md 跳过。 完成后输出 Token 总消耗和项目文件清单。回车AI 就自己开始干了。AI 自己的开发节奏整个过程我没有干预AI 按这样的节奏跑npx create-next-app初始化项目安装依赖创建 SQLite 数据库和 API 路由写仪表盘页面跑npm run build——报错自己修写历史列表页跑构建——通过写新增表单页跑构建——又报错修了 2 轮通过最终全量验证npm run build npm run devAI 自己维护了一个 PROGRESS.md记录每轮做了什么、碰到什么问题、怎么修的。这就是前面说的状态记忆。验收大概跑了 11 分钟AI 建了 12 个文件碰到 3 次构建报错全自己修了最后npm run build一次通过。http://localhost:3000三个页面正常渲染CRUD 功能跑通。可能有人会问这不就是让 AI 一把梭吗跟我直接说帮我写个项目有区别吗区别大了。直接说「帮我写个项目」AI 一次性输出所有代码你复制进去大概率跑不通——AI 不知道你的 Node 版本、依赖冲突、文件路径。而 /goal 是逐轮执行、每轮验证的写一个模块就跑一次构建报错了当场修。反馈闭环的价值就在这——不是最后才检查是每一步都在检查。五、实战用 /loop 做定时任务如果/goal是让 AI 替你干活/loop就是让 AI 替你盯着。举个我实际在用的场景有个小项目的服务偶尔会挂时间不固定。以前每隔一会就手动curl一下烦得很。现在/loop 10m 检查 http://localhost:3001/api/health 是否返回200。连续2次返回非200给我桌面通知。每次检查结果记录到 health-check.logAI 每 10 分钟盯一次挂了就通知我该干嘛干嘛。更多实用场景/loop 30m 扫描代码库检查是否有新的安全漏洞上报/loop 1h 检查 GitHub Issues 有没有新带 bug 标签的 issue有就汇总通知/loop 5m 检查 CI/CD 构建状态构建完成就通知记住/loop会一直跑任务达成就停掉。六、把普通提示词改造成 Loop 的三步法你可能会想我用的是 Cursor 或者 Codex没有 /goal 命令怎么办Loop Engineering 的核心不是某个命令是一套方法论。在任何工具里只要在提示词里嵌入循环机制一样能跑出 Loop 效果。第一步模糊需求改成可验证的停止条件改前帮我写一个博客项目。改后从零搭建博客项目直到 npm run build 通过且浏览器能正常访问首页、文章详情页、管理后台。有了明确的可验证条件AI 才知道什么时候算做完了。第二步加状态追踪文件在项目根目录维护 PROGRESS.md记录当前阶段、已完成事项、进行中事项、遇到的问题和解决方案。每完成一个模块更新一次。这样 AI 不会忘了自己做过什么你也能随时看进度。第三步加反馈闭环每完成一个功能模块立即运行编译或测试验证。有报错就先修复再推进。同一问题修复超过 5 次仍未解决记录到 PROGRESS.md 后跳过继续推进其他任务。这就是开发-验证闭环加防死循环熔断。完整模板以上三步整合起来直接套用## 任务目标 {你的项目描述尽量具体} ## 停止条件 {13 个可自动验证的条件如npm run build 通过、所有测试绿、lint 零报错} ## 自主开发循环 1. 状态追踪项目根目录维护 PROGRESS.md记录当前阶段、已完成事项、进行中事项。每完成一个模块更新一次 2. 开发-验证闭环每完成一个模块立即编译或运行验证。有报错就修复通过后才推进 3. 防死循环同一问题修复超过 5 次仍未解决记录到 PROGRESS.md 后跳过继续推进 4. 最终验证全部完成后做一次端到端验证 全程自主开发不要停下来等我确认除非遇到无法自行解决的阻塞问题。在 Cursor 或 Codex 里用这个模板效果跟/goal很接近。为什么需要防死循环Loop 跑久了最常见的翻车就是陷入死循环——AI 反复修同一问题修不好或者修好了又引入新问题。所以我建议三个熔断条件都配上同一问题重试上限建议 5 次单轮 Token 预算比如 200K tokens进度停滞检测连续 3 轮 PROGRESS.md 无变化说明 AI 卡住了七、踩坑与省钱指南Loop 用起来爽坑也不少。下面是我亲自踩过的几个。Token 不是烧的是放烟花第一次用/goal没设熔断目标写了个「重构整个项目」。AI 跑了 50 分钟花了快 80 万 Token效果还不如我自己花 2 小时重写。Loop 是个杠杆——能撬动你的工程能力也能撬翻你的项目。启动前先想三件事目标能不能量化做完值不值这个 Token 钱跑崩了有没有 Plan B一个/goal省 2 小时手工操作花 5 块钱 Token值。跑了 50 块还搞砸了要返工纯浪费。OverbakingAI 开始自己加戏这是我碰到的最有意思的坑。有一次让 AI 搭一个 CRUD 后台目标写太松——「做一个功能完善的管理系统」。跑了 20 分钟AI 开始给项目加用户权限系统、操作日志、甚至还有个「暗黑模式切换」。这些功能我一个没要但 AI 觉得「功能完善」就该有这些。这个现象社区叫 Overbaking 过度烘焙——Loop 跑太久、目标约束太松AI 开始给自己加需求。最早在 Ralph Wiggum Loop 的实践中就被发现了有人用它让 AI 在循环里不断重构代码跑太久之后 AI 开始乱加功能、乱删测试。解决目标写清楚做什么和不做什么设轮次上限跑完人工审查再合并。调试比提示词难十倍Loop 跑了 47 轮后出问题很难定位是第几轮埋的坑。建议从小目标开始每轮让 AI 写清楚做了什么、结果如何PROGRESS.md 就是你的调试日志。学习路径刚开始用 AI 编程、还在 Vibe Coding 阶段的话先别急学 Loop。把提示词技巧练好学会用 CLAUDE.md 给 AI 项目上下文。等你到了「AI 能写出我想要的代码但每次都得我一步步推」这个阶段Loop 该上场了。从/goal开始就够给 AI 一个小目标让它跑一轮感受下节奏和 Token 消耗。顺手之后再加定时循环、熔断机制这些进阶玩法。最后Loop Engineering 不是什么魔法就是把「你推着 AI 走」换成了「你定规则AI 自己走」。从提示词工程到上下文工程再到 Harness 和 LoopAI 编程的自动化程度越来越高。但工具越强你作为决策者的角色越重要——Loop 设计得好不好、目标拆得清不清楚、反馈机制靠不靠谱全看你的工程判断力。Loop 像一台大功率音响——你给它放什么歌它就放大什么。放好歌整个场子都炸了。放噪音全场捂着耳朵跑。用它来加速你真正理解的工作别让它替你思考本该自己搞懂的问题。