AI 时代维根斯坦的语言游戏
AI 时代维根斯坦的语言游戏一句话主张大模型是一台无规则的规则玩家。它没有私人意义但它被无数语言游戏压印出了用法。我们这些做产品、做 Prompt 的人本质上是在给它写新的规则书。1. ChatGPT 让哲学家重新上班2022 年底OpenAI 把一个能写诗、能 debug、能陪你聊苏格拉底的模型推到了几亿人面前。半年之内哲学教授们发现自己的工作有了新搭子——不是同行而是这个奇怪的概率水母。为什么因为 AI 的几乎所有争议都能追溯到一个老问题机器有没有理解这个问题在 1953 年被一位剑桥哲学家换了一个角度回答。他叫路德维希·维特根斯坦他在《哲学研究》第一句就把我们拉到了工地上我教他……一边指着石头一边教他说石头这个词。《哲学研究》§1他不是说石头背后有一个叫石头概念的东西在闪烁。他说的是词的意义就是我们拿它去做的那些事。维特根斯坦管这叫语言游戏Sprachspiel。语言不是一个静态的词典而是一堆随场合变化的小游戏点菜、下命令、念诗、骂人。2. 重读《哲学研究》用法即意义维特根斯坦晚年的核心主张可以压成两句话词的意义就是它在语言中的用法。不要在用法背后找什么本质。他举了一个特别工程师的例子工地上 A 喊板子B 递给他一块木板。如果 A 说的是板子但是想要的是水泥板B 就会愣住然后纠正他。这里的板子既没有一个柏拉图式的板子理念也不在 A 脑子里。它就在两人共同遵守的游戏规则里。他还说过一句被引用到烂的话我的语言的界限就是我的世界的界限。§5.6——这句话在 AI 时代尤其要小心地读。它不是我想不到的就不能说而是我能用得动的语言就构成了我能生存的世界。这给我们一个非常实在的判断框架一个 AI 能不能理解一个词不在于它脑子里有什么而在于它能不能在这个词该出场的地方正常出手。3. AI 里的语言游戏从规则到概率那么问题来了大模型到底有没有规则显式的规则书没有。大模型没有一张写好的板子→木板的字典。它的内部是一堆从语料里学来的权重几十亿个浮点数。这些权重可以看成是无数次语言游戏的痕迹。打个不严谨但好用的比方维特根斯坦的语言游戏像棋——你学棋先学规则再做死活题。大模型的语言游戏像一只看了几亿盘棋、但没人告诉它规则的狗。它会下棋但你问它马走日它不一定能说出规则——它会在该跳马的位置跳马。这就是为什么维特根斯坦的用法即意义在 AI 时代变得既有用又危险有用它让我们放弃模型是否真的懂这个伪问题去看它能不能在正确的位置上做出正确的动作。危险它也容易让我们把看起来像用法误认成用法——模型在 99% 的场合都按某游戏规则出手剩下那 1% 就是幻觉。所以今天我们谈 AI 的理解是在谈一种功能性理解它在统计意义上用法对齐得足够好好到可以参与我们的语言游戏。4. Prompt是咒语还是规则书Prompt 工程被很多人当咒语——换几个关键字、堆一些 emoji模型就乖乖听话。这是一种误解。从语言游戏的视角看Prompt 是一份局部规则书。你在告诉模型这一局我们要玩的是这个游戏。请按这个游戏的玩法出牌。一段有效的 Prompt通常会包含三类信息角色定义模型扮演谁、面向谁说话。这是维特根斯坦说的上场——不同的上场就有不同的玩法。任务约束哪些事能做、哪些事不能做。这对应的是规则边界。样例与格式给出输入—输出示例。这是最贴近用法的部件——你不是在解释规则你是在示范怎么玩。举一个最小例子。把同一个问题交给模型咒语式请扮演一个资深工程师回答下面问题。规则书式你是一个有 10 年后端经验、熟悉 Go 和 Postgres 的工程师。回答使用中文先给结论再给原因。如果不确定明确说我不确定。后者赢在显式规则覆盖了该游戏的玩法不是更恭敬而是更对局。5. 多 Agent 与工具调用扩展棋盘维特根斯坦还有一个反直觉的观察语言游戏不只一种没有哪个游戏是真正的语言所有游戏都是家族相似的一团。对应到 AI 时代这个判断几乎是字面意义上的一个 Agent 是一种游戏研究员 Agent 用搜索 阅读 总结的玩法。多 Agent 是把多个游戏拼在一个棋盘上研究 Agent 把材料交给写作 Agent写作 Agent 把草稿交给审核 Agent。工具调用是给游戏加新棋子调用搜索是加了一只眼调用 Python 解释器是加了一只手。每一次工具调用本质上都在回答同一个问题在这一局里查和算分别是哪个动词这是在给一个本来只会说的模型加上一堆原本不属于说话这个游戏的动词。这也是为什么我越来越不喜欢Prompt 工程师这个头衔。真正的工程不是写更好的咒语是设计更好的游戏。6. 家族相似与嵌入空间维特根斯坦举过一个反本质主义的例子游戏。棋牌、足球、扑克、过家家它们之间没有共同的游戏本质只有一层一层的家族相似——有的有得分有的有对手有的有规则书。今天的大模型把这件事做了几何化。词变成向量向量在嵌入空间里按用法分布。语义相近的词在空间里靠近反之远离。我们甚至可以直接看一个名词在模型语境里被什么动词搭配画出一张用法地图。幻觉在这种视角下特别好理解模型在嵌入空间里走出了一段没有真实游戏支撑的距离。它在语义上连续但在用法上脱节。所以 RAG检索增强这种工程手段可以这样理解把外部的用法证据贴回到这段距离上让模型重新落到正确的游戏里。它不是在让模型更有知识而是在给模型配齐它该有的棋谱。7. AI 时代的意义即使用把维特根斯坦拿来用不是为了装高雅。是因为他这套工具今天真的能解决我们工程上的几个具体问题评估模型时不要只看答案对不对要看它在该用法的位置上是不是稳定出手。同一个 prompt 的微小扰动会不会让它瞬间出戏设计产品时把用法场景显式化。让模型知道这是客服局、那是教学局、那又是创作局。少让它做万金油。设计评测集时多收集边缘用例——那些看起来荒唐但确实会出现的输入。它们正是模型脱离家族相似的高发地段。回到开头那句话词的意义就是它在语言中的用法。大模型没有私人意义但它的用法对齐质量可以被训练、被测量、被产品化。8. 和维特根斯坦一起做产品维特根斯坦在《哲学研究》的最后一句说我读过的东西里凡是我说不出来的地方我就只能含糊其辞。如果你今天做的是 AI 产品那么反过来也成立凡是用户说不出来、你也含糊其辞的地方模型也一定会含糊其辞。工程师的工作就是把这些含糊的地方一条条钉清楚——变成 Prompt、变成规则、变成工具、变成评测集。这件事做完AI 就会从一只会下棋但不会讲规则的狗变成一个虽然仍有边界、但能在牌桌上稳定出牌的搭档。维特根斯坦大概不会去做产品。但他的语言游戏比任何一份产品需求文档都更诚实地提醒我们意义不在词里不在脑子里只在用法里。延伸阅读Wittgenstein,Philosophical Investigations重点 §1–§7, §66, §108, §241Kripke,Wittgenstein on Rules and Private Language规则怀疑论的经典讨论Wei et al.,Chain-of-Thought Prompting把推理用法显式化的代表工作Schick et al.,Toolformer工具调用 往语言游戏里加新棋子