本文介绍了AI领域的新概念“Loop Engineering”作为继Prompt和Context工程之后的又一次技术飞跃。通过分析Loop Engineering如何帮助大模型更好地与外部世界交互实现更复杂任务的管理与调度阐述了其在提升AI应用效率与智能化水平方面的巨大潜力。同时文章也指出了Loop Engineering在实际应用中可能面临的成本问题并强调技能积累的重要性。对于希望在大模型领域深入学习的小白和程序员来说本文提供了宝贵的入门知识和实用建议。擅于创造新词的美国 AI 圈子又双叒叕创建了一个新的词Loop Engineering说实在的在看到 Harness Engineering 时我就感觉其实没有什么太多新的东西在模型智能已经发展到现在这种程度的情况下除了模型本身做好周边的工程化工作也能带来更大的提升。那我们看看什么是 Loop Engineering 吧…发展历程在 AI 最近三年多的过程中我们已经遇到过几个这样的 Engineering从中可以看出 AI 的发展历程。Prompt Engineering 提示工程在 ChatGPT 时刻以后我们最先使用的场景是 chatbot通过页面或一些客户端应用跟大模型直接聊天。在这个过程中需要一些技巧把我们想问的问题整理得有条理这样能让大模型产生更好的回答。它关心的是指令怎么写、例子怎么放、格式怎么约束、角色/目标/边界怎么设定。它可以出现在多轮里但它的主要单位仍然是一次模型调用。实测17种提示词工程技术Context Engineering 上下文工程大模型有几个先天的限制大模型是没有记忆的模型的注意力是稀缺资源模型的上下文窗口是稀缺资源大模型的上下文大小从最初的几十K到上百K再到现在的普遍支持的1M虽然在不断加大但是人类的任务也越来越复杂上下文空间再大也可以被用完。而且当上下文太多时有不同方向的信息放在一起也会使大模型猜测不到我们的要点从而产生回答偏差。那么在完成复杂任务时我们就要将根据RAG检索到的资料、历史保留的信息、工具调用结果的摘要、哪些信息信息该压缩、哪些信息该隔离。在 Context Engineering 中重要的是调用醋前在有限的上下文窗口中构造最适合当前任务的上下文状态。Context Engineering长上下文是如何失效的Context Engineering: 如何修复上下文一文读懂上下文工程(Context Engineering)所有的一切都是上下文 - 深入研究Claude体系的感悟Harness Engineering这个词是随着Claude Code、Codex等 Coding Agent 快速发展而产生的。说实在的刚开始时对 Harness 翻译成马具我非常不理解感觉这个词又不好理解也不好听。后来我是联想到古代马镫的进化才慢慢理解了它的意思。而通过对 OpenClaw (龙虾) 开源代码的学习才开始体会到这其中的意味。下面这张图很形象在马镫发明之前大家都是在光光的马背上驾驭战马那么越好的马可能越难以驾驭而且对骑手的要求也很高。但是马镫发明以后一方面对骑手的要求降低了一方面可以更好地发挥战马的能力。现在模型的能力越来越强但是它还是不能自己读取我们的代码库、不能自己操作我们的电脑、不能自己调用各种工具、不能时时更新的自己的知识库等等这时就需要一个 Runtime运行时) 的助手帮它完成这些脏活、累活还要帮助它形成记忆(文件、数据库等等)最后还要将所有的这些信息组装成有效的 Context(上下文) 再提供给模型只到模型完成预定的目标。Harness 解决的是agent 怎么行动它给 LLM 工具、权限、文件、浏览器、测试、数据结构、计划机制让它能和外部世界发生接触。什么是 Loop Engineering?从 Prompt Engineering 到 Context Engineering再到 Harness Engineering都是以模型的能力为基础通过工程化的方法更好地与模型进行交互从而完成越来越复杂的工作。那么还缺少什么呢什么样的工作是可以接受的龙虾(OpenClaw) 爆火的主要原因是它能完成的任务已经与我们日常的工作很相近了所以大家能理解它能做什么。我记得当时各种自媒体中讲的都是它能自己完整地完成这个、完成那个等等等等。我自己在使用 Claude Code 或 Codex 或 AntiGravity 这样的 Coding Agent 的时候已经完全不自己写代码它写完之后我的主要职责是评估和测试。所以经常的流程是人 - 给目标 - agent/harness 执行 - 人检查 - 人继续提示或结束在 Claude Code 中我们可以利用 Hooks 增加一些检查点在模型已经判断结束的基础上增加一些检查点但是总体上任务还是需要人来进行判断。这还不够智能。Loop 是做什么的Agent 的核心是一个调用循环它给模型提供了任务信息以及可能使用的工具模型自己会判断该调用哪个工具通过 Harness Runtime 去执行这些工具然后将工具的结果返回给模型再进行下一次判断只要模型认为任务已经完成为止为人类提供一个摘要由人类判断任务结果是否满足要求。那么Loop 解决的是agent 什么时候继续、什么时候修正、什么时候结束、什么时候升级给人。它把原来人类在旁边做的判断工程化“你还没做完继续。”“测试失败了回去修。”“issue 信息不够先追问。”“这个任务风险太高暂停等人确认。”“结果已经满足验收标准可以结束。”有 loop 时人 - 给目标/规则/预算/验收标准 - loop 控制器 - agent/harness 执行 - 收集结果 - 判断是否完成 - 不完成则继续、修正、重试、拆分或升级 - 人看最终结果或关键异常这相当于为原来的 Agent 又加了一层管理多个任务、多个 Agent Loop 的调度循环。真正动手时它是什么样子的Boris Cherny (Claude Code的创始人) 使用 Claude Code 中的/loop命令利用一行 prompt 演示了最经典的入门实例。把下面这行贴进去改掉名词。/loop babysit all my PRs. Auto-fix build issues, and when comments come in, use a worktree agent to fix them.几天后Boris 发了五条让 Opus 自主跑几小时甚至几天的建议。权限用 auto 模式这样 Claude 就不会来要批准用 dynamic workflows 让 Claude 编排成百上千个智能体去完成一个任务用 /goal 或 /loop 推 Claude 一直干到完在云端用 Claude Code这样你就能合上笔记本以及确保 Claude 有办法端到端地自我验证它的工作。— 2026 年 6 月在最近 X 上很多人讨论 Long-Running其实就是怎么通过不断的 Loop让 Agent 能长时间地运行不过我觉得这个已经太复杂了太深入的地方等乃至再深入学习也不迟说不定(概率很大)过两天又出现个新词替代掉 Loop Engineering 呢Loop 有什么样的代价呢通过Long-Running、可以完成完整的任务在这些美好的愿景下是什么呢龙虾当时在中国的推进是由国内的模型厂商推动的字节、阿里、Minimax、GLM都推出了云端的各种 Claw腾讯还在演进推出免费为用户安装龙虾小米虽然推出的较晚但是现在也推出了自己的 Claw而它们看到的都是以后 Agent 的烧 Token 的能力。如果没有各种 Coding Plan单单按 API 计费可能没有多少人能真正用得起龙虾当然也包括Claude Code、Codex等等。那么现在再这个内循环(inner loop)的基础上又增加了一层外循环(outer loop)可以想见对 Token 的需求量又会成倍的增加。最近的新闻Uber 在四个月里烧光了全年的 AI 预算后把工程师的 Claude Code 和 Cursor 上限定在了每人每工具每月 1500 美元。一旦模型几乎免费地写好了代码成本就转移到了跑它的循环上。在 AI 时代学习新的技术名词的同时也要时不时掂量一下自己的钱袋子因为每次调用都是真金白银地在花钱最后的一点补充有另一个反复出现的观点与loop那条配成一对而且是更耐久的那一半一件事如果你要做不止一次就把它做成一个自动化 skill一件事如果你觉得难做完之后也把它做成一个 skill这样下次就是免费的。一个里面没有任何可复用 skill 的循环只是一个围着一个陌生人转的 while-true。一个调用着一库锋利、经过测试、有名字的 skill 的循环才是一个会复利增长的系统。我觉得这也是给我们提了一个醒不论关于 Agent 的工程结构如何变化有一些最基本的能力却是越来越有用Skills 可能是现在最重要的基础设施之一而将自己的业务与场景结合起来 Skills 是人人都可以做到的事情。真要学习的话先把这些基础知识学好还有一点我觉得国内大模型如果能把 Agentic 能力做得更好通过 Harness 或 Loop 这些不管什么 Engineering 都好就可能在更多的实用场景中发挥更大的作用也真正能帮到希望真正使用 AI 的用户或企业又好又便宜地改造自己的工作。最后如果说程序员已经是高薪职业那么干AI的程序员就是高薪中的高薪。现在的市场已经用数据给程序员指明了方向学AI大模型就是冲刺高薪的最优解看着身边越来越多的同行转型大模型、拿到高薪offer很多人心里都动了心但真正的难题来了零基础小白不知道从哪入门有基础的程序员找不到系统学习路径实战项目练手无门面试不知道考什么别慌今天就给大家整理了一份【2026年最新版】AI大模型免费学习资源包覆盖从入门到实战、从理论到面试、从基础到进阶的全流程所有资料均已整理归档无冗余、无套路免费分享给每一位想抓住AI风口的程序员和小白扫码免费领取全部内容1、大模型系统化学习路线2、大模型学习书籍文档3、AI大模型最新行业报告4、大模型项目实战配套源码5、大模型大厂面试真题四阶段精细化学习规划附时间节点可直接照做结合上述资源给大家整理了一份可直接落地的四阶段学习规划总时长约2个月小白可循序渐进程序员可根据自身基础调整节奏高效掌握大模型核心能力快速实现从“入门”到“能落地、能面试”的跨越。第一阶段10天初阶应用该阶段让大家对大模型 AI有一个最前沿的认识对大模型 AI 的理解超过 95% 的人可以在相关讨论时发表高级、不跟风、又接地气的见解别人只会和 AI 聊天而你能调教 AI并能用代码将大模型和业务衔接。大模型 AI 能干什么大模型是怎样获得「智能」的用好 AI 的核心心法大模型应用业务架构大模型应用技术架构代码示例向 GPT-3.5 灌入新知识提示工程的意义和核心思想Prompt 典型构成指令调优方法论思维链和思维树Prompt 攻击和防范…第二阶段30天高阶应用该阶段我们正式进入大模型 AI 进阶实战学习学会构造私有知识库扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架抓住最新的技术进展适合 Python 和 JavaScript 程序员。为什么要做 RAG搭建一个简单的 ChatPDF检索的基础概念什么是向量表示Embeddings向量数据库与向量检索基于向量检索的 RAG搭建 RAG 系统的扩展知识混合检索与 RAG-Fusion 简介向量模型本地部署…第三阶段30天模型训练恭喜你如果学到这里你基本可以找到一份大模型 AI相关的工作自己也能训练 GPT 了通过微调训练自己的垂直大模型能独立训练开源多模态大模型掌握更多技术方案。到此为止大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗为什么要做 RAG什么是模型什么是模型训练求解器 损失函数简介小实验2手写一个简单的神经网络并训练它什么是训练/预训练/微调/轻量化微调Transformer结构简介轻量化微调实验数据集的构建…第四阶段20天商业闭环对全球大模型从性能、吞吐量、成本等方面有一定的认知可以在云端和本地等多种环境下部署大模型找到适合自己的项目/创业方向做一名被 AI 武装的产品经理。硬件选型带你了解全球大模型使用国产大模型服务搭建 OpenAI 代理热身基于阿里云 PAI 部署 Stable Diffusion在本地计算机运行大模型大模型的私有化部署基于 vLLM 部署大模型案例如何优雅地在阿里云私有部署开源大模型部署一套开源 LLM 项目内容安全互联网信息服务算法备案…扫码免费领取全部内容6、这些资料真的有用吗这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理现任上海殷泊信息科技CEO其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证服务航天科工、国家电网等1000企业以第一作者在IEEE Transactions发表论文50篇获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。资料内容涵盖了从入门到进阶的各类视频教程和实战项目无论你是小白还是有些技术基础的技术人员这份资料都绝对能帮助你提升薪资待遇转行大模型岗位。这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】