Claude Fable 5 被禁,OpenRouter Fusion API 多模型协作成新选择!
Claude Fable 5停用与OpenRouter Fusion API登场Claude Fable 5 周末被停用后成了许多人心中逝去的白月光原本定好的Claude Fable 5开发者大会主角也临时调整为Opus 4.8。然而知名AI模型聚合平台OpenRouter带着Fusion API闪亮登场。它自称是市面上最聪明的「拼盘模型」智力接近Fable价格却只要一半。截至发稿前OpenRouter这条推文已冲到518.5万阅读。Fusion API的新思路与机制Fusion API展示了一种新思路模型能力不一定只能靠参数协作本身也能产生增益。Fusion本质上是一套「多模型协作」机制与传统大模型不同它会把同一个问题同时交给多个模型独立研究再综合结果。整个流程分为三步并行研究多个参与模型在相同工具权限下独立完成搜索、资料整理和答案生成交叉评审裁判模型阅读所有答案分析共识、分歧等生成结论主模型根据评审结果完成信息整合输出最终答案。因此Fusion的核心是通过独立研究等提升结果质量。测试验证与成绩分析为验证协作模式是否有效OpenRouter采用Perplexity AI发布的DRACO作为测试基准。DRACO专门评估深度研究能力包含100道任务覆盖10个领域考察多方面能力评分标准严格。在测试里Gemini 3 Flash等三个模型组成团队由Opus 4.8负责综合最终拿到64.7%。对比来看GPT - 5.5单独作战为60.0%Opus 4.8单独作战为58.8%Fable 5单独作战成绩是65.3%。这意味着Fusion的平价组合距离Fable只差不到1个百分点但成本约为后者一半。此外OpenRouter还做了让两个Opus 4.8组成双人小组的实验最终拿到65.5%的DRACO成绩相比单独运行的Opus 4.8提高了6.7个百分点。原因是同一个模型面对同一问题可能走出不同推理路径答案对比时有机会发现遗漏等。OpenRouter估算Fusion带来的提升里约四分之三来自综合环节本身只有四分之一来自模型之间的多样性。DeepSeek V4 Pro的表现也让OpenRouter意外它单独运行时拿到60.3%与GPT - 5.5和Opus 4.8处于同一水平。OpenRouter猜测这与不同模型的工具使用习惯有关Opus 4.8更依赖频繁调用工具Fable则更倾向先规划再行动。不过这组成绩也有需要注意的地方。不同裁判模型可能带来10 - 25分的绝对分数波动成绩不宜直接与论文数据对比但相对排名较稳定。Fable的成绩并非基于完整100题因内容过滤限制Fable 5有7题未完成最终按剩余93题计算与其他完成全部100题的模型并非完全同条件比较。测试中部分模型联网搜索时意外找到DRACO评分标准OpenRouter认为并非主动作弊但仍可能影响公平性后续将相关页面加入黑名单并重新测试最终公布的成绩均来自屏蔽后的结果。Fusion的使用与前景对于开发者来说Fusion的使用非常简单直接将模型名称替换为openrouter/fusion 即可自动调用默认组合也可自定义参与模型和裁判模型。从目前数据来看多模型协作的收益明显至少在深度研究任务上「开会式」协作比单打独斗更容易取得更好结果。单体模型仍然重要但模型协作有机会成为新的AI基础设施。Fable被禁背后的故事Fusion爆火的前提很难绕开Fable。Fable 5和Mythos 5最近被美国政府出口管制全球用户被暂停访问Anthropic内部持外国国籍的员工也无法使用自家最新模型。据报道把这件事推到关键位置的是Anthropic的头号金主、亚马逊CEO安迪·贾西。亚马逊研究人员测试Fable 5时发现「越狱」方法贾西将测试结果递交给相关高层美国国家网络事务总监随后召开紧急会议最终选择用出口管制应对留给Anthropic的响应窗口一度只有90分钟。知情人士称美国政府要求Dario Amodei修复漏洞但他拒绝了。Anthropic官方将越狱案例定性为「轻微发现」并表示其他公开模型也存在类似问题但美国政府和亚马逊未接受该解释。微妙的是亚马逊从2023年起已累计向Anthropic投入130亿美元并计划追加最多200亿美元最大的投资人成了推动模型下架的关键角色。接近美国政府的人士称这次出口管制大概率不会扩散到其他AI公司更像是针对Anthropic最新模型的精准限制。随后Anthropic给用户发出通知Opus、Sonnet、Haiku仍然可用使用额度会重置若用户不满意可在6月20日前从网页端取消订阅系统会按比例自动退款通过苹果渠道订阅的用户则需走苹果自己的退款流程。“复活”Fable的尝试与国内模型的表态Fable虽贵但停用前开发者社区已对它研究透彻。Django核心开发者Simon Willison曾分享体验他让Fable排查简单CSS问题模型自动完成一系列自动化调试流程还花掉约12美元。这意味着编程Agent几乎能完成终端里的所有操作前沿模型掌握的技巧远超普通开发者认知一旦受恶意指令影响主动性会带来潜在风险。Fable被停用后有人试图「复活」它。开发者Jamieson OReilly做了一个实验探究Fable的「性格」来自模型权重还是系统提示词。他将一段提示词喂给Opus 4.8与原版Opus 4.8做对照给两边发相同任务后输出页面有明显差异。Jamieson兴奋发推称是否解锁了claude - fable - 5 - lite但这无异于照猫画虎提示词无法补出模型的真实能力。与此同时国内模型也借势表达立场。智谱宣布GLM - 5.2向GLM Coding Plan全量用户开放覆盖多个版本。智谱表示前沿智能应开放、可用、可构建服务于每一位开发者。