一、从 AI Coding 到 AI BuilderAI 写代码已不稀奇真正难的是让 AI 在复杂业务系统里按目标、按边界、按质量标准持续生产。得物推荐围绕 PDCA 全链路搭建 AI Harness让需求可约束、执行不断点、效果可度量、经验可复用。过去一年AI Coding 体验成熟但在真实工程系统里“能跑” 不等于 “按目标生产”。推荐系统链路长、模块多AI 若只停留在 Do 阶段只是更快的代码生成器而非推动业务迭代的工程伙伴。核心变化是 AI 化整个周期闭环。二、为什么只做 AI Coding 不够传统工程迭代可抽象成 PDCAAI Coding 主要解决 Do但复杂系统失败不只在 Do。做 AI 的目标是让 AI 进入完整迭代飞轮实现目标更清晰、执行不断点、效果可量化、经验可复用。三、Harness 的本质不是铁笼而是环境讲 Harness 前可联想《楚门的世界》楚门受环境约束。好的 AI Harness 把目标等能力做进协作环境让 AI 不易越界每一步都在可验证、可回滚、可复用的工程上下文里。七阶段护栏把 PDCA 拆成可度量协作面七阶段护栏全面覆盖 PDCA。四、Plan用 Contract 把需求变成护栏很多需求失败源于理解错误自然语言 PRD 对 AI 有歧义。Plan 阶段核心是把需求改造成 AI 能理解、执行、验证的结构化契约。得物推荐实践中T - PRD 把需求拆成 EP 并绑定相关内容以 “负反馈调权” 为例说明。五、Do让 AI 开发零等待AI 自主开发怕 “等人”写完代码跑不起来等情况会让它变成昂贵的自动补全。六、Check让推荐效果 7x24 可度量推荐系统 Check 难传统方式成本高、反馈慢。Axis 推荐 AI 评测平台引入 AI 评审员不是替代线上实验而是增加体验风险雷达。AI 全量评分专家抽样复核并沉淀知识。AI 评测目的是暴露体验风险、沉淀评审口径。七、Act把 Bad Case 变成下一轮能力线上出现异常系统进入 Bad Case 捕获等流程问题排查应留下可复用路径。八、七阶段之后还有三个深层痛点流程护栏能解决问题但 Agent 本身有知识丢失、行为漂移、路径不透明等局限是工程化承载问题。九、知识治理文档给人看Coding 给 AI 戴枷锁程序员和 AI 都面临文档问题。得物推荐把知识分三层L3 注释实验显示补充后简单问题准确率从 52% 提升到 91%复杂问题准确率达 100%token 消耗下降整体成本降低。十、推查查Highway 与 ATV 的混合 Agent 架构推荐链路排查场景中80% 问题高频可复现20% 问题长尾复杂。两类问题不应使用同一种 Agent 路径解决。Highway 原则是不脑补把稳定路径写进代码LLM 负责结果润色。ATV 针对 20% 长尾问题提供工具等让 Agent 自主探索成功后沉淀为新的 Highway 能力。十一、NOW从单点提效到工程复利当 Plan、Do、Check、Act 被 AI Harness 治理收益是整个迭代系统运转。体系价值是让工程系统适合人和 AI 合作。十二、尾声碳硅梦蝶庄子有梦蝶之惑如今 AI 协作也有类似错觉。我们把 AI 当人用也把人当 AI 用。Harness 是梦境边缘保证 AI 和人类有规则和流程支撑。最终命题是把 AI 纳入可控、可度量、可复用的工程协作系统。下篇预告「得物推荐 AI Harness 工程化实践系列」中篇《推荐系统诊断 Agent从 “调接口” 到 “会思考”得物技术》将基于本文进一步拆解更多原理和工程落地细节。往期回顾1. [从表单到 Agent得物社区活动搭建的 AI 实践之路]2. [从埋点需求到规则资产Hermes Agent 重构得物数仓工作流]3. [让 Claude Code 拥有自我进化和记忆系统得物技术]4. [用 LLM Agent 重构告警排查流程得物技术]5. [HorizonVault 技术深潜如何在 HDD 上做出 100GB/s 级大吞吐分布式存储得物技术]