从心理学家的奇想到AI革命:游戏正在重塑世界模型的未来。
你有没有想过我们日常玩的电子游戏或许会成为训练下一代AI的绝佳试验场82年前一名31岁的苏格兰心理学家提出了一个颠覆性假说人类思考的底层逻辑是在大脑内部搭建一套现实世界的简化模型依靠这套模型预判事态、做出决策。这套理论沉寂数十年如今借着AI浪潮在游戏赛道迎来落地爆发。今天我们就来拆解这项理论将如何改变整个科技行业。一、80年前一位天才的猜想在当下终于得到验证。1943年第二次世界大战还未结束现代数字计算机尚未问世。苏格兰心理学家肯尼斯·克雷克Kenneth Craik撰写了一本不到200页的著作——《解释的本质》。在这本书中他提出了颠覆当时学界的观点人类能够进行思考并不依靠虚无缥缈的“心灵意识”本质是大脑为外部现实构建了一套简化的内部模型。遇到问题时人类不必在现实里反复试错只需要在大脑模型中推演模拟就能筛选最优行动方案。他将完整的思考逻辑拆解为三步感知把外界信息转化为大脑可以识别的符号预测依托符号逻辑推演预判后续会发生的状况决策将推演结果转化为实际行动。感知‑预测‑行动这套闭环时至今日依旧是所有AI世界模型的底层逻辑。可惜这位天才没能亲眼见证自己理论落地。1945年欧洲胜利日前一日Craik遭遇车祸离世年仅31岁。事后有资料记载爱因斯坦在读过他的著作后评价其为一部极具前瞻性的作品。后续几十年里人工智能、认知科学领域的研究者不断引用他的理论。在他离世后这套思想分化成三大研究方向控制论、认知科学、人工智能。1991年部分AI学者提出“智能不一定依赖内部模型”该论调让世界模型研究进入将近二十年的停滞期直到2018年这套理论才重新回归大众视野。二、AI科研界达成共识游戏是训练世界模型的最优试验场。2018年Google‑Brain团队联合AI领域学者施米德胡贝Schmidhuber发布论文《World‑Models世界模型》让沉寂已久的概念重新重回AI主流赛道。团队为AI赋予了“虚拟推演做梦”的能力AI不需要持续和真实环境交互可以在自身生成的虚拟场景里提前学习行为模式再把习得的能力迁移至现实环境。研究团队以赛车游戏开展对照实验AI先在自己生成的虚拟赛道内完成训练迁移到原版游戏环境后就可以完成竞速。自此该赛道迎来高速发展从Dreamer算法到MuZero模型大量实验都印证了依托世界模型做预判决策效果优于无模型的直接强化学习。时至今日世界模型已经从一项小众AI技术演变为整个人工智能行业新的技术范式。纵观该领域的所有重大突破绝大多数实验都依托游戏环境完成背后存在四大核心原因自带标注数据每一帧游戏画面对应玩家键鼠、手柄的操作行为天然形成输入‑输出数据集省去人工标注的高昂成本。谷歌训练Genie模型时取用了20万小时游戏视频素材如果换成自动驾驶数据集同等量级的标注成本动辄数亿元。物理规则逻辑固定游戏内的重力、碰撞、流体等底层物理逻辑复刻现实世界。简化后的物理环境降低了AI的学习门槛AI先在虚拟场景习得基础规律再迁移落地到现实机器人、自动驾驶项目。海量数据供给充足仅Steam平台就拥有十几万款游戏全球日均游戏玩家数以亿计。单游戏录屏平台每年可沉淀20亿条带操作记录的游戏片段体量是自动驾驶、具身智能行业很难企及的。动作范式已经定型数十年的游戏发展已经将人的主观意图凝练为键鼠、手柄标准化的操作指令不用AI从零摸索行为逻辑。二者属于双向赋能关系游戏不只是世界模型的训练载体世界模型同样会革新游戏行业。当下传统游戏的NPC行为、物理交互都是开发人员硬编码写死的交互模式被提前限定。如果接入世界模型NPC可以根据实时场景自主做出反应物理规则实现自主涌现游戏的开放度和沉浸感会被大幅拉高。三、各大科技巨头相继入局游戏企业成为AI新战场。2024年被视作世界模型商业化落地元年多个标杆项目优先以游戏作为试验场景吸引资本与各大科技企业扎堆布局。谷歌做出了标志性实验用神经网络重构1993年的经典游戏《DOOM》摒弃传统游戏引擎的渲染管线、碰撞检测代码。怪物行动、子弹轨迹、门体开关全部由神经网络进行预测依靠模型推演生成下一帧画面帧率可以稳定达到20FPS。受限于技术现状该版本仅能复刻老旧游戏记忆窗口仅3秒但已经证实游戏逻辑可以通过模型学习生成不必依靠人工硬写代码。后续Google DeepMind推出迭代版Genie系列模型实现了仅依靠游戏视频就能从零生成全新可交互三维虚拟世界。迭代至2025年的Genie 3已经能够生成时长一分钟、逻辑稳定的可交互3D场景Waymo也将其用于自动驾驶仿真测试。整个产业逻辑就此打通世界模型需要大量带行为标记的视频数据自动驾驶、人形机器人这类具身智能需要借助世界模型理解现实物理规律而游戏刚好补齐二者的中间环节资本迅速嗅到了风口。最具代表性的案例是游戏录屏平台Medal.tv。创始人拒绝OpenAI开出的5亿美元收购邀约独立创立AI企业General Intuition一年时间完成4.54亿美元融资企业估值攀升至23亿美元。其核心壁垒就是平台每年沉淀的20亿条、附带完整操作行为的游戏片段创始人将其定义为下一代大模型预训练的核心数据源。韩国《绝地求生》开发商KRAFTON布局更为激进2025年宣布全面转型AI优先型企业投入1000亿韩元搭建GPU算力集群成立独立AI子公司还联合韩华航空航天研发物理AI技术。企业对外明确表态长期运营大型线上游戏、搭建虚拟物理环境的经验是训练AI的核心资产依托世界模型业务可以从游戏延伸至国防仿真领域。英伟达搭建世界模型底层基础设施Cosmos平台定位为物理AI的基础底座再结合Isaac‑Sim机器人仿真平台打通“游戏引擎—世界模型—实体机器人”的完整技术链路。原本服务游戏行业的引擎技术如今成为训练物理AI的底层支撑。腾讯作为全球规模最大的游戏厂商手握混元大模型、庞大算力储备以及完整的游戏产业生态。尽管还没有公开布局人形机器人赛道但整个行业都在观望腾讯什么时候依托游戏数据切入具身智能赛道。四、延伸思考未来机器人未必是人形形态。很多人会产生固有认知用游戏数据训练机器人就必须复刻人类形态依托人类肢体动作进行学习。这里其实存在一个思维误区。一套手柄按键逻辑既可以操控《艾尔登法环》的人形角色挥剑、翻滚也能操控GT赛车完成漂移还能操控GTA的直升机起降。同一套指令可以适配完全不同形态的物理载体。这就说明游戏里的玩家操作数据本质不是人形肢体的动作样本而是“主观意图环境反馈”的对应关系。世界模型从海量游戏数据里学到的不是双足人形如何走路而是在动态环境下如何通过动作达成既定目标。因此未来的机器人不一定非要做成人类外形也不局限于双足行进。只要可以把自身意图转化为对应动作这套行为逻辑完全能够依托海量的游戏人类行为数据训练习得。回望整条技术脉络从1943年Craik提出大脑内部模型理论到如今AI依靠游戏数据训练实体机器人。碳基人类、硅基AI实现智能的底层逻辑始终一致构建世界模型、推演预测、再执行行动。当年Craik提出过一个核心观点只有依靠内部推演模型人类才能预判还未发生的事以此节约时间、成本规避风险。如今这套逻辑正从人脑迁移到AI身上而游戏就是最好的训练场。这位在31岁骤然离世的心理学家没能见证自己理论落地的时代。可他当年脑海中那个简化的世界模型构想如今正被写成代码、化为模型参数慢慢落地成能够感知现实、自主行动的智能机器人。【总结】游戏早已不止是娱乐载体。当下它正在成为人工智能理解现实物理世界的课堂而世界模型也重新改写了游戏的商业价值——从文娱产品升级成下一代AI的基础设施。这一轮技术变革最先吃到红利的除了AI企业还有手握海量游戏数据的游戏厂商。