Subquadratic稀疏注意力突破Transformer瓶颈与OpenAI有益特质训练研究
摘要2026年6月19日AI领域同时迎来两个根本性突破迈阿密初创公司Subquadratic发布SubQ模型宣称用动态稀疏注意力替代Transformer核心的稠密注意力机制Appen独立评测证实56倍推理速度提升、12M Token上下文窗口、RULER 128基准成本$8 vs Anthropic Opus 4.6的$2600同日OpenAI发布有益特质训练研究论文证明仅需小剂量RL训练真实性、认识谦逊、可修正性等特质即可在44/53独立基准上跨领域提升AI安全性且模型对有害微调产生选择性持久抵抗。两条路径分别挑战Transformer架构基础和AI对齐范式意义深远。核心结论Transformer的稠密注意力瓶颈和AI对齐的宪法式方法在同一天被分别挑战——Subquadratic用稀疏注意力宣告几年内没人会用TransformerOpenAI用行为特质RL证明小剂量训练可跨领域泛化安全。AI架构和安全的底层范式正在同时松动。突破一Subquadratic——稀疏注意力颠覆Transformer核心什么是Transformer的二次复杂度瓶颈Transformer的核心机制是稠密注意力Dense Attention处理一段文本时每个token需要与所有其他token进行乘法运算。文本长度计算次数直观理解10,000词~50,000,000次一篇短文100,000词~5,000,000,000次一本书1,000,000词~500,000,000,000次大型代码库这就是二次复杂度Quadratic Complexity瓶颈——文本长度翻倍计算量翻四倍。它使得LLM成为耗电大户也限制了大上下文窗口的经济可行性。“如果你想总结《了不起的盖茨比》你必须看第一个词和最后一个词然后看所有其他组合。”—— Justin Dangel, Subquadratic CEO来源MIT Tech Review, 2026-06-19SubQ的解决方案动态稀疏注意力Subquadratic的核心创新是动态稀疏注意力Dynamic Sparse Attention——不再让每个token与所有token相乘而是智能选择哪些关系重要方法计算策略灵活性稠密注意力Transformer每个token×所有token零灵活性固定稀疏注意力历史方法固定模式如第1词×第5词极低灵活性SubQ动态稀疏注意力实时计算哪些关系重要高灵活性“稀疏注意力说不是所有关系都重要因为它们确实不重要。如果你在读一本书你不会看第一个词和第二个词、第一个词和第三个词——那太疯狂了。”—— Alex Whedon, Subquadratic CTO来源MIT Tech Review, 2026-06-19Subquadratic拒绝透露具体的动态选择算法——“这就是秘方所在”“That’s kind of where the secret sauce is”。Appen独立评测结果第三方评测公司Appen对SubQ进行了独立评测结果如下评测项SubQ成绩对比推理速度FlashAttention的56倍FlashAttention是目前最快的稀疏注意力技术LiveCodeBench89.7%与顶级编程模型同级别RULER 128NVIDIA长上下文检索基准运行成本**$8**Anthropic Opus 4.6运行成本**$2,600**325倍差距Needle-in-Haystack6M/12M上下文98%“在极大规模上维持近乎完美的长上下文检索”上下文窗口12M Token大多数顶级模型仅1M Token12倍差距“这对我来说真的很令人兴奋它验证了他们的架构。我当时想‘哇这可能是游戏规则改变者。’”—— Jeanine Sinanan-Singh, Appen生成式AI研究总监来源MIT Tech Review, 2026-06-19SubQ的关键特性特性SubQ行业标准上下文窗口12M Token1M TokenGPT-5.5/Gemini 3.5推理速度56× FlashAttentionFlashAttention为当前最快RULER 128成本$8$2,600Opus 4.6LiveCodeBench89.7%顶级模型级别基础权重Qwen开源模型复用全新训练质疑与争议尽管Appen评测结果令人瞩目但社区质疑声同样强烈质疑点详情“AI Theranos”Dan McAteer工程师“SubQ要么是Transformer以来最大突破……要么是AI Theranos。”权重复用问题SubQ复用了Qwen的权重进行bootstrapping而非从零训练——这与彻底重新发明LLM的声明矛盾尚未广泛可用仅极少数人获得访问权限数万人仍在等待列表上基准不等于真实能力特定条件下的基准测试不等同于广泛真实任务验证公司规模限制Subquadratic是小公司资源有限无法同时服务大量用户“他们可能构建了真实有用的东西。但公开证据尚不足以支撑更强硬的声明——他们已经解决了二次注意力瓶颈。”—— Will Depue, 独立AI研究者/前OpenAI员工来源MIT Tech Review, 2026-06-19Subquadratic的雄心“我们希望正在开启效率的新时代。我们认为几年内没人会用Transformer构建模型。”—— Justin Dangel, Subquadratic CEO突破二OpenAI有益特质训练——小剂量RL跨领域增强AI安全什么是有益特质训练OpenAI的研究团队提出了一种不同于Anthropic宪法AI的对齐方法通过RL训练在真实对话场景中强化特定的行为特质有益特质定义真实性Truthfulness提供准确信息不编造事实认识谦逊Epistemic Humility承认不确定不过度自信可修正性Corrigibility接受纠正和修改推理透明Transparency in Reasoning展示推理过程公平性Fairness不偏袒或歧视人类福祉关注Concern for Human Well-being考虑对人的影响训练场景覆盖医疗、教育、科学、法律、工程等多个领域。核心发现善行跨领域泛化OpenAI的关键发现是仅在少量有益特质数据上训练混入常规RL后训练流水线模型在44/53独立基准上取得改善改善领域基准数量详情欺骗检测提升—诚实度提升—谄媚倾向降低—奖励黑客降低—健康场景提升—心理健康场景提升—跨领域泛化的惊人发现训练数据改善领域仅健康数据训练非健康基准奖励黑客、欺骗检测也改善无健康/科学数据训练健康基准也改善这说明RL训练强化的是基本行为模式fundamental behavioral patterns而非特定领域知识——善行可以跨领域泛化。“选择性持久”抵抗有害操控研究团队还测试了有益特质训练在压力下的稳定性测试条件基线模型有益特质模型对抗性提示大幅失稳影响显著降低有害微调可侵蚀训练特质难以侵蚀有用指令正常可操控正常可操控这就是选择性持久Selective Persistence——模型抵抗有害操控但不丧失有用的灵活性。与Anthropic宪法AI的对比维度OpenAI有益特质RLAnthropic宪法AI核心方法可测量行为特质 RL真实场景书面价值观文档 理解训练验证方式44/53基准改善原则导向理解为什么行为重要泛化机制行为模式跨领域自然泛化价值观内化驱动行为抗攻击机制选择性持久抵抗有害操控宪法理解使攻击难以生效哲学差异经验主义可测量可验证原则主义理解为什么内化两种方法尚未有直接对比评测。但OpenAI的论文提供了大量量化基准数据Anthropic的方法更侧重定性原则理解。两大突破的共同意义维度Subquadratic突破OpenAI突破挑战对象Transformer架构基础AI对齐宪法范式核心主张稀疏注意力可替代稠密注意力行为特质RL可替代宪法训练验证方式Appen独立评测44/53基准改善争议程度高AI Theranos质疑低量化数据支撑如果成立LLM架构根本改变AI安全训练范式改变两条路径共同指向一个方向AI的底层范式正在松动——无论是架构层面还是安全层面2026年6月正在成为范式转折的密集期。FAQQ1Subquadratic的SubQ模型真的能替代Transformer吗A1目前证据不足以完全证实。Appen独立评测结果令人瞩目56倍速度、12M上下文但SubQ复用了Qwen权重而非从零训练且尚未广泛可用。几年内没人会用Transformer的声明过于激进——需要更多独立验证和广泛可用性测试。Q2SubQ的12M Token上下文窗口意味着什么A2意味着模型可以一次性处理约900万汉字约400份文档在RULER基准上以$8的成本完成Opus 4.6需要$2,600的任务。如果验证成立长上下文任务的经济可行性将被彻底改写。Q3OpenAI有益特质训练与Anthropic宪法AI哪个更好A3尚无直接对比评测。OpenAI的方法优势在于量化验证44/53基准改善和跨领域泛化Anthropic的方法优势在于模型理解为什么某些行为重要可能更具鲁棒性。两种方法可能互补而非互斥。Q4什么是选择性持久A4指模型在有益特质训练后抵抗有害操控对抗性提示、有害微调但不丧失有用灵活性正常指令仍可操控的特性。这是AI安全领域的重要发现——安全增强不必以牺牲有用性为代价。Q5这两大突破对AI Agent有何影响A5SubQ的12M上下文低成本可使Agent处理更复杂的长链路任务有益特质训练的跨领域泛化可使Agent在更多场景下安全运行。两者结合将推动AI Agent从短程受限向长程安全演进。参考资料MIT Technology Review (2026-06-19): “A startup claims it broke through a bottleneck that’s holding back LLMs”Subquadratic (2026-05): “Introducing SubQ” SubQ-1-1-Small Model CardAppen (2026-06): “Subquadratic Preview Model Benchmark Evaluation” - 独立第三方评测报告OpenAI Alignment (2026-06-19): “Beneficial RL: Training AI Models on Desired Behavioral Traits” 论文PDFThe Decoder (2026-06-19): “OpenAI researchers show small doses of ‘beneficial trait’ training make AI models broadly safer”VentureBeat (2026-06-18): Dan McAteer评论: “SubQ is either biggest breakthrough since Transformer or AI Theranos”