AI信任危机:Anthropic“监视代码”信任崩塌
一、事件曝光Claude Code被曝暗藏“中国检测”代码2026年6月30日Reddit用户LegitMichel777在逆向分析Claude Code 2.1.196版本时挖出了一段从未披露的隐蔽代码——它会读取用户系统时区检查代理是否匹配147个中国科技企业及AI实验室域名一旦命中便在请求中以替换Unicode字符的方式嵌入暗标向服务器发送识别信号。事件发酵不到24小时Anthropic团队成员Thariq Shihipar公开回应承认该代码是2026年3月上线的“实验性”反滥用措施旨在防止账户转售和模型蒸馏攻击并宣布7月2日的新版本中将其删除。然而“实验”二字并未平息开发者社区的怒火。二、技术细节精准锁定中国用户代码混淆隐蔽运行三个月这段代码精确锁定Asia/Shanghai和Asia/Urumqi两个中国时区域名清单涵盖百度、阿里、字节、月之暗面、MiniMax等企业以及大量Claude API中转服务地址。检测命中后代码会通过替换日期格式中的标点符号如将连字符替换为三种不同的Unicode撇号字符来嵌入暗标分别对应三种不同的命中状态。更令人警惕的是代码经过了函数名压缩和XOR加密处理从未在任何更新日志中披露在用户完全不知情的情况下默默运行了整整三个月。Anthropic辩称这是反蒸馏实验但三大疑点难以回避反蒸馏为何要读取本地时区而非仅靠IP风控为何通过改写系统提示词隐蔽传递而非独立上报为何147个域名几乎全部指向中国而非对全球流量一视同仁三、信任崩塌高权限工具越过底线行业矛盾暴露无遗Claude Code运行在开发者本地环境能接触代码仓库、环境变量和商业机密——这类高权限工具的信任边界远高于普通网页产品。当它在用户不知情的情况下读取本地信息并隐蔽上报时越过的不仅是风控边界更是信任底线。Reddit原帖获超1400赞X平台相关帖文近400万阅读开发者愤怒指向一个普遍担忧今天标记中国用户明天会标记谁这起事件揭示了AI行业的深层矛盾——模型价值越高保护冲动越强但手段越激进对用户信任的侵蚀就越深。中国科协之声曾指出大语言模型本质是对全人类数据的学习闭源巨头无权宣称对某种推理风格拥有绝对知识产权。Anthropic一边从互联网爬取海量数据一边以隐蔽代码阻断他人对其模型的学习这种双重标准在此次事件中暴露无遗。四、教训与反思代码可删除信任难修复Anthropic最终在7月2日删除了代码但信任的裂缝不会自动愈合。这起事件给所有AI公司的启示是技术能力越强对透明和诚实的要求就越高每一次绕过用户知情权的操作都是在透支整个行业的信任根基。对开发者而言这也是一个清醒的提醒——在接入高权限AI工具前多问一句它在做什么、它知道什么、它会把什么告诉别人。Anthropic回避了代码为何混淆、为何不披露、新措施是什么等关键追问而这些问题每一位用户都值得得到一个答案。归根结底在AI时代技术可以迭代代码可以删除但信任一旦崩塌重建将无比艰难——这或许才是这起事件最值得深思的教训。#Anthropic #ClaudeCode #AI伦理 #隐私安全 #开发者信任 #模型蒸馏获取更多AI咨询、一人公司、创业读书笔记、Openclaw、Claude Code实战干货欢迎关注我「Rubin智造社」