软件吃掉了世界的一半:从规则化到 token 化的产业轨迹
近些年来市场好像陷入了创新瓶颈已经很久没有新的现象级产品出现所有的需求似乎都被处理得差不多了。真正难啃的是那些无法被规则化的问题虽然有真实的业务价值但谁也没法把它们写进一份需求文档一动笔就会发现到处都是模糊地带到处都需要具体情况具体看一下。这种情况很容易被解释成软件行业进入了存量时代或者模式创新到头了。但我觉得这不是周期问题而是软件这门生意本身一直走在一条叫规则化的轨迹上而这条轨迹在某个时刻达到了能力上限。直到 LLM 出现事情开始发生变化。但变化的方式跟很多人理解的并不相同。它不是AI让软件更智能也不是 AI 替代了一部分程序员它在做的是一件更底层的事情它拓宽了原本软件建立在规则上的轨迹发展出了一条新的轨迹。一、软件这年只吃掉了世界的一半Marc Andreessen 在 2011 年写过一篇影响很大的文章标题是《Why Software Is Eating the World》这话后来被反复应验。软件不断侵蚀重塑着各行各业。但如果今天回头再看会发现这话其实只对了一半。软件并不是完整的吞掉了世界。它吞掉的只是世界里能被规则描述清楚的那一部分。剩下的另一半从来没有被它真正触碰过。工程师们其实最清楚只是平时不会往这个角度想。我们写过的每一个系统背后都有一个隐含的前提这件事必须能被拆成步骤必须能被定义成状态必须能被表达成一组判断条件。能拆得清的我们能写出来拆不清的我们就只能在文档里留一句具体处理逻辑由人工介入。回顾一下软件这几十年到底吃掉了什么会看得更清楚。记账被搬进了 ERP是因为复式记账法已经把所有可能发生的账务变化拆成了有限的几种规则。沟通被搬进了 IM是因为传递一段消息这个动作本身没有什么需要想一下的地方谁发给谁、什么时候、是否已读全是确定的状态检索被搬进了搜索引擎是因为人对相关性的需求被简化为了一组可计算的指标出行被搬进了打车软件是因为从 A 到 B 这个需求的核心结构非常稳定每一次被吃掉都先经过了同一道关问题必须能先被规则化。这不是一种风格选择而是软件作为一种工程产物的底色。可调试、可测试、可审计、可托付这些性质全都建立在行为是被规则描述出来的这个前提之上。一段代码之所以能被信任是因为它不会今天这样执行、明天那样执行。它只会按写出来的逻辑跑。规则化是软件能成为基础设施的前提而不是它的某种偏好。所以软件吃掉世界从一开始就有一个被忽略的限定条件它吃的是世界里那部分能按规则行事的现实。规则化得越彻底的领域软件渗透得越深规则化得不彻底的领域软件只能停在外面看着。二、规则化只能盖到人类需求的一半由此自会引出下一个问题那剩下的那一半到底是什么它其实不远就在我们每天的工作里。一个产品经理写了一份方案他真正想要的不是用 Word 排版好。他想要的是有人帮他看一下这份方案是否合理逻辑里有没有他自己没意识到的漏洞。一个律师拿到一份合同他真正想要的不是用 PDF 转存一下。他想要的是有人帮他判断这份合同里的风险藏在哪几条。一个产品负责人看到上线后用户没买账他真正想要的不是在 BI 里跑个查询。他想要的是有人告诉他用户为什么不买账。一个工程师写完一段代码他真正想要的不仅是测试跑通。他想要的是有人帮他判断这段判断逻辑在他公司这个具体业务下到底站不站得住脚。这些需求过去没有一个真正被软件解决过。不是因为没人想做这些需求每一个都对应着巨大的市场咨询业、律所、产品研究。它们都有人在做只是做这件事的不是软件是人。也不是因为没人尝试做。过去十几年里专家系统、规则引擎、决策树、知识图谱一波又一波地试图把这些需要想一下的工作搬进系统。每一次都能在某个垂直场景里跑出 demo但谁也没法跑成一种通用的能力。原因都一样它们没法被规则化。每一个具体场景背后都有一段想一下而思考这件事无法被 if/else 写出来。这就是很多问题背后的答案为什么软件公司越来越在拼运营、拼增长、拼用户体验不是因为产品经理们都堕落了而是因为容易被规则化的需求池子已经见底了。能数字化的部分基本都数字化完了再往前走碰到的全是这事得有个人想一下的硬骨头。规则化吃不下去就只能在已经吃下去的那一半里精耕细作优化界面、缩短路径、提升留存。这不是没价值但本质上不再是拓展新大陆而是在已经被开垦的土地上精耕细作。为什么 SaaS 公司过了某个规模就特别难再往上走因为它能服务的需求是有限的。所有客户都用同一套规则规则覆盖不到的部分就只能让客户自己处理或者让乙方驻场处理。每多一个非标客户就多一段无法被产品吸收的特殊性。这种特殊性本质上就是规则化盖不住的那一部分。为什么咨询业、律所、心理咨询、医生这些行业过去几乎没被软件动过因为它们的核心交付物全都是想一下。一个咨询顾问的价值不在于他用什么工具产出报告而在于他在面对你这个具体公司、这个具体问题时形成了一段判断这段判断没法被预先写下来因为它是当场思考出来的。规则这条轨迹走到这里就不动了。它不是在某一个产品上碰壁而是在一整条供给路径上难以寸进剩下的需求每一个都得有人想一下而想一下这件事过去从来没法变成一种可批量供给的资源。三、token 让想一下第一次变成可调度的资源LLM 真正改变的正是这点。但它带来的改变不是很多人讨论的模型变聪明了、参数更大了、benchmark 更高了这些都是技术层面的事实但它们不是这一波变革的真正变量。真正变量是软件第一次开始能够处理那些没法被规则化的领域问题。token 这个词容易被理解成 AI 的计费单位就像 CPU 时间或者带宽流量。但它真正的含义远不止于此。一个 token 背后是模型的一次推理动作它读了上下文里的所有内容做了一段不能用规则完整描述的处理然后把它转化成了一段输出。这段输出可能是一段文字也代表着一个判断、一个分类、一个决策。也就是说token 是把一段思考切成了很小的、可计量的、可花钱购买的颗粒。这在过去是做不到的如果你想让一段思考成为某个数字化流程的一部分唯一的办法是雇一个人。人有上下班有情绪有薪资结构有招聘成本。思考从来不能像电力那样按需供给它只能以一个加入团队的完整的人为最小单位。token 让这思考第一次真正的接近按需供给。需要一次判断调一次 API需要一万次判断调一万次 API。需要在秒级响应里嵌入一段思考可以需要在一个长流程里反复调用思考也可以。这个思考的质量未必能赶上一个资深专家但它的可调度性是过去任何形态的思考都做不到的。黄仁勋这两年反复在讲一条算力分层从电、数据中心、模型一路讲到上面的应用。这条供给链很完整但它讲的是供给侧的事算力越来越便宜、模型越来越强、应用越来越多。供给最终在产出什么、在改变什么他没怎么具体展开。如果非要给那条供给链一个落点落点可能是它最终输出的是一种新型的、可被随时调用的思考颗粒。至此软件吞噬世界的方式就有了第二条轨迹它刚刚开始走的不是规则化的路径而是把需要想一下这件事直接变成可调度资源让那些过去因为规则化盖不住而留在外面的需求第一次有了被数字化的可能。这两条路并不互相替代。规则化能吃下去的部分仍然以规则化的方式存在没必要换形态。但规则化盖不住的那一半开始松动了。过去很多产品里判断那一步是空着的让用户自己来。简历筛选的时候过去 HR 系统能做的只是把简历存起来、做关键词过滤这个人到底合不合适得 HR 自己看完简历再判断。现在这一步可以被填进去系统能给出一段对这个人是否合适的初步判断HR 在这个判断的基础上做最终决定。同样的事发生在合同初审、报告摘要、客服分流、内容审核里。那些过去因为判断盖不住而被留给人来做的环节开始有了软件能介入的方式。过去用户使用软件要先把自己的问题翻译成软件能理解的形式。要搜索什么得先想清楚关键词要查什么数据得先把需求拆成菜单选项要让系统执行什么操作得先按它定义的形式表达。这种翻译动作过去全部由用户承担因为软件没有能力理解未经翻译的需求。现在这层翻译可以被 token 做了。用户可以用自然语言表达需求系统在中间做一次想一下把它转化成自己能执行的形式。这层变化看起来只是交互层的事但它打开的是一整条之前因为用户不会翻译而流失掉的需求。过去软件的长尾是没法做的每个用户的具体情况都不一样规则覆盖不过来做了大客户的需求就照顾不了小客户做了主流场景就吃不下边缘场景。所以做产品要砍需求要把长尾砍掉只保留能被一套规则覆盖的主流。现在长尾第一次有可能被吃下去因为 token 可以当场为这个具体情况想一段判断而不需要事先把所有情况都列出来。这并不意味着所有长尾都会立刻被吃下去但路径已经存在了。四、当下的所有 AI 产品都在用 LLM 模拟一个人讨论完这条新轨迹的存在之后下一个问题就出来了这条轨迹上的软件应该是什么样如果观察今天看市场上的答案会发现结果是高度一致的Agent。不管叫法是 AI 助手、智能体、Copilot 还是数字员工都是相同的逻辑给它一个角色设定、一份岗位说明、一组工具然后让它像一个人那样接活、思考、调用工具、产出结果。AI 客服扮演接线员AI 程序员扮演工程师AI 销售扮演 BDAI 研究员扮演分析师。整个行业仿佛达成了一种默契LLM 这个新东西最自然的用法就是去模拟一个人。这件事如果只是某一两家公司的选择那是产品决策。但当所有人都不约而同走到这条路上就值得停下来想一想了为什么是模拟人我觉得很关键的原因是在 LLM 出现之前思考这件事在我们的认知里只有一种载体就是人我们没有别的模型可以参照。所以当一种新的、可被调度的思考能力出现时我们能想到的第一种用法自然就是把它装回我们最熟悉的那个容器里一个虚拟的人有角色、有上下文、有任务、有产出。这个用法本身没有错它是这条新轨迹上能被立刻搭出来的最近的一个落点也确实在很多场景里跑得通。但它很可能不是终点它更像是这条轨迹上的第一个形态是我们这一代人受限于自己的思维惯性所能想到的第一个答案。再过一些时间回头看今天满屏的 Agent 产品可能跟这条轨迹真正成熟之后的样子差得相当远。为什么有这样的判断就要先离开软件看一段并不遥远的历史。五、电机用了四十年才不再是一台更好的蒸汽机蒸汽机普及之后工厂仍然倾向于建在水边。这件事乍听起来不合常理蒸汽机的好处不就是可以不依赖水力吗为什么还要建在水边答案是因为过去几百年里工厂只有一种组织方式就是围绕水车展开。水车必须建在水边动力从水车出来经过一根中央传动轴再用皮带分发到每一台机床。蒸汽机出现之后工厂主们做的第一件事不是重新设计工厂而是把蒸汽机放在原来水车的位置上让它带动同一根中央传动轴皮带照旧。蒸汽机被当成了一台更好的水车在用。后来电机也出现了。电机本来在物理形态上跟蒸汽机完全不同它可以做得很小可以分布式部署每一台都能独立工作。但工厂第一次用电机的时候做了什么呢把它放在工厂中央带动那根熟悉的中央传动轴皮带照旧分发到各个工作台。电机被当成了一台更好的蒸汽机在用。工厂主们不是不聪明而是当时除了中央动力 皮带传动这种组织方式没有见过别的形态。新能源被装进了旧的使用方式里生产力的提升非常有限。真正的变化要等到大概四十年后。有人开始在每一台机床上各装一台小电机。这一步看起来很小但它打开了一个全新的可能性动力不再需要被集中、再分发它可以直接安装在每一个需要它的地方。一旦这个模式被应用工厂的物理布局就被彻底解放了机床不再要排成一长串以迁就传动轴而是可以按工艺流程自由排布流水线由此才真正成为可能。福特的流水线、现代制造业的整套秩序都是从这一步开始的。电机真正的革命不是它替代了蒸汽而是动力可以被安装到任何位置这点被人想明白了。我们现在做 Agent本质上是在搭会思考的虚拟员工。一个 Agent 一个工位一个角色一份岗位说明任务从入口接进来、从出口送出去。这套结构和过去的人类组织几乎是一一对应的。它能跑通但它没有真正利用 token 这种东西的特性思考可以被切得极小、嵌入任意位置、按需供给。Agent 把它重新打包成了人这个容器。这不是说 Agent 错了。它在今天显然是有用的而且会持续有用很长时间就像中央电机带动总传动轴的工厂也实实在在地运行了几十年但它大概率不是最终形态。六、再往后软件可能不再像人如果 Agent 不是终点那终点可能是什么样这件事谁也说不准正如 1890 年没人能想象出福特的流水线。但顺着前面那条类比往下推有几个方向是可以隐约看到的。第一思考可能从被打包变成被分散。今天我们把 token 打包成一个 Agent是因为我们需要一个完整的角色来对接现实里的某个岗位。但当工程实践成熟之后token 完全可以像小电机一样直接长在软件每一个需要想一下的判断点上。每一个 if/else 后面每一个原本写着具体情况具体看一下的地方都可以挂一段当场进行的判断。软件不再像今天这样是规则的主体加一个外挂的 Agent而是规则和判断深度交织在一起你很难再分清楚哪里是代码、哪里是模型。第二主流程和长尾的边界可能消失。过去做产品要不断砍需求因为规则化的成本是固定的只能覆盖到主流场景长尾必须被砍掉。Agent 时代这个问题缓解了一些可以让一个 Agent 兜底处理那些规则覆盖不到的请求。但它本质上还是一种主流走规则、长尾走 Agent的分层结构。再往后如果判断真的可以被弥散到每一个节点那么主流和长尾在工程实现上的成本差就会被抹平。长尾不再需要被特别对待因为它本来就被吸收在每一段当场进行的判断里。一个产品能服务的客户范围可能因此被打开很多。第三规则化基础设施不会消失但会被重新组织。数据库、消息队列、配置中心、规则引擎这些东西不会因为 token 的出现而消失它们仍然是软件能被信任的基础。但它们在新范式里扮演的角色可能会从承载主流程退到承载确定性骨架而上层会被分散的判断颗粒重新组织起来。规则负责兜底token 负责想通两者交织成一种新的软件结构。这种结构今天还没有被清晰地命名出来但它正在被零零散散地试出来。当然以上都是方向性的猜测不是预言。具体的形态是什么样、什么时候出现、由谁先做出来今天没人知道。我们现在能做的只是不要把今天的 Agent 当成终点不要因为今天看到的就是这些产品形态就以为这条轨迹只会这样发展。七、软件的未来演化回到最初的讨论软件吃掉世界这件事在 2011 年只对了一半。软件其实从来没有吃掉整个世界它只吃掉了世界里能被规则描述清楚的那一部分。剩下那一部分那些需要想一下才能处理的需求一直留在外面因为它们没法被规则化。这不是软件的失败而是软件作为一种工程产物的边界规则化是它的力量来源也是它的能力上限。LLM 真正改变的正是这条边界。它不是让软件变得更聪明而是给了软件第二条路径把那些规则无法消化的需求通过 token 的方式吃下去。这条新路径不替代旧路径它们会同时存在各自处理各自能处理的那部分。但软件这门产业能伸到的版图第一次开始往规则之外扩张。这不会很快从能数字化到敢用、从敢用到敢托付、从敢托付到能审计这条路过去走规则化软件走了几十年。token 化软件大概率也要走类似的节奏我们正处在这条路的开头。今天看到的所有 AI 产品无论它们多么炫目都还只是非常早期的形态。要把这条路真正探索通需要的不只是更强的模型更是围绕模型的整套工程治理评估、护栏、监控、审计、责任划分。我们之前讨论的所有约束、所有架构、所有工程实践本质上都是在为这条新路铺路。软件吃掉世界下一个十年才刚刚开始。本文出自我的开源书籍《AI编程的第一性原理》欢迎阅读原本https://github.com/caozhiyi/ai-programming-book