人形机器人设计正在向仿真器低头!40年机器人从业老兵发出警告
近日有着 40 多年机器人从业经验的工程专家、RoboStrategy 机器人投资研究总监 Scott Walter 发出疑问「为什么人形机器人设计变得 S.T.U.P.P.I.D.」人形机器人行业正出现一种吊诡现象机器人还没学会走得更远设计却先学会了向仿真器低头。为了让仿真系统跑得更顺为了让强化学习更顺滑有些原本更有机械优势的结构正在被主动删掉。并联关节、线性驱动、远程传动、肌腱式手部结构本该是工程师用来榨出性能的武器现在却因为「仿真麻烦」被排除在外。问题开始变得尖锐我们到底是在造更好的机器人还是在造一个更听仿真器话的机器人近日有着 40 多年机器人从业经验的工程专家、RoboStrategy 机器人投资研究总监 Scott Walter 发出疑问「为什么人形机器人设计变得 S.T.U.P.P.I.D.」这里的 S.T.U.P.P.I.D. 全称为被仿真器掐住脖子的低效产品集成设计Simulation Throttled Underperforming Product Integration Design。他接着详细解释了为什么自己会有这样的感触以第一人称工程师向来喜欢 DFx 原则比如 DFM 是面向制造的设计DFA 是面向装配的设计DFQ 是面向质量的设计。每一种原则都在问同一个问题为了服务下游约束设计应该如何调整去年年初NVIDIA 的 Jim Fan 博士提出过 DFS也就是面向仿真的设计。他的观点很直接如果你的人形机器人技术栈无法被仿真强化学习基本就可以告别了。用 Jim Fan 自己的话说「…… 稳健的硬件和电机设计应该把仿真视为一等公民……」「…… 过去仿真经常是事后才考虑的东西。现在它必须成为硬件设计流程的一部分。如果你的机器人仿真效果不好强化学习基本就没戏了。硬件与仿真协同设计是一个非常有意思的新兴方向也只有在今天的算力条件下才真正变得有意义。」这个判断有道理。仿真确实很难Sim2real gap 也真实存在。领先团队要想大规模训练人形机器人的策略核心手段之一就是把物理仿真跑到比真实时间快几个数量级再在数百万个环境中进行域随机化。问题出在另一个地方。DFS 作为训练原则可以成立一旦变成设计原则就危险了。而且这种情况正在越来越多地出现。并联关节机构原本在机械上更有优势结构紧凑可以分担扭矩性能也更好。现在它们正在被设计出局只因为仿真起来太麻烦。旋转执行器开始比线性驱动更受欢迎原因未必是性能更优只是建模更省事。远程驱动越来越不受待见。串联运动链正在胜出靠的并非机械价值而是更容易被仿真器处理。这已经偏离了真正的设计。这就是 S.T.U.P.P.I.D.。我自己做机器人和仿真工程已经超过 40 年。早年我曾经天真地在一场主要工业机器人 OEM 厂商的聚会上建议他们要不把机器人设计得简单一点让仿真更容易他们给我上了职业生涯中最好的一课笑了。而且他们笑得对。问题出在我们仿真团队的能力上。后来我们的仿真器也确实因此变得更好。仿真应该服务设计。它的作用是帮助工程师探索完整的设计空间帮助团队在制造之前完成验证更快找到更好的结果。关系一旦颠倒你限制的就不只是设计自由度连设计本身都会被拉低。更深层的问题仍然是能力问题。完整仿真人形机器人技术栈确实非常难。你需要正确建模执行器动力学、运动学、系统中的反射惯量还要把系统辨识做准确。这并非数学问题。方法我们都知道。真正麻烦的是算力账要把这些东西算对计算成本极高。所以很多团队开始走捷径。惯量靠估算重心数据靠修反射惯量不知道怎么建模就猜一个。域随机化被当成胶带用来勉强固定一个摇摇晃晃的系统。然后最荒唐的一步来了他们不去修仿真反过来去改机器人让真实机器人去适配这些捷径。工程师们太害怕 sim2real gap于是开始让现实向仿真低头而非让仿真追上现实。例子已经摆在眼前一些智能电机控制器正在主动限制电机输出让响应更线性以便匹配仿真。Unitree 新的 H2把 G1 上经典的 RSU 并联踝关节改成了串联结构用来适配强化学习而他们并不是第一个这么做的团队。手部设计团队也在放弃肌腱结构因为直接驱动更容易仿真。这就是本末倒置。工程师一直都在和不完美模型打交道这很正常。我们知道模型在极限条件下会失效所以设计时会尽量避开这些区域。但接受仿真能力的边界和把设计主导权交给仿真器是两回事。KISS 原则也就是 Keep It Simple, Stupid确实是工程智慧。设计足够优雅、足够简单因此刚好也容易仿真这当然很好。那是一种自然出现的额外收益。可如果你删掉机械优势只因为仿真团队处理不了复杂性那你遵循的就不是 KISS而是 S.T.U.P.P.I.D.。仿真是工具产品另有其物。仿真应该服务设计而不该反过来主宰设计。我们不会为了让结构分析软件高兴去设计一座桥。我们使用软件是为了验证这座桥不会塌。人形机器人也是同样的逻辑。仿真的存在价值是服务设计探索空间压力测试假设更快抵达更好的硬件。仿真一旦变成产品本身你就已经离开了工程开始做另一种东西。最好的人形机器人设计应该从机器人真正需要什么出发而不是从仿真器能处理什么出发。Scott 对人形机器人行业的判断引起了圈内人士的共鸣机器人 AI 研究科学家、Agility Robotics AI 创新负责人 Chris Paxton 认为他点出了一个趋势现在有些人设计人形机器人时会优先考虑让 Isaac Lab英伟达开源的统一的模块化机器人学习框架更容易仿真和控制而不是去改进仿真器本身或者解决其他底层问题。有意思的是这个问题其实已经存在一段时间了。Chris Paxton 自己之前接触过某款人形机器人因为腿部结构里有很大的闭环机构在仿真里就经常遇到类似麻烦。可以看出仿真技术迟早会成为机器人能力上限的一部分。。机器人手臂 / 灵巧操作创业者 Matt Freed 也表示自己认同 Scott 的判断。今天相当一部分机器人手部方案其实是在为错误的需求做优化。这些设计未必能顺利迁移到真实世界部署中。更大的问题在于如果做硬件的团队和训练模型的团队彼此分离关于「什么才是真实有效需求」的反馈闭环就会变得非常慢。这两类团队必须紧密耦合在一起。对于那些不自己做手、不自己训练模型、不自己部署、也不在真实场景中持续迭代的公司我并不看好。因为只有把硬件、模型、部署和迭代放在同一个闭环里团队才可能真正理解要让机器人在真实世界里变得有用究竟需要满足哪些要求。这场争论的核心并不在于仿真重不重要。恰恰相反越是想把人形机器人推向真实世界越离不开高质量仿真、强化学习和大规模策略训练。真正需要警惕的是仿真从工程工具变成了设计边界。当一个行业为了让仿真更顺手开始主动放弃更有潜力的机械结构当硬件团队和模型团队彼此割裂只能围绕各自最容易处理的问题做优化当真实世界里的复杂性被反过来压扁成仿真器喜欢的样子人形机器人就很容易走向一种表面高效、实际受限的路线。