本周 AI 新动态精选(2026.06.08–06.14)
本周 AI 新动态精选2026.06.08–06.14 月之暗面 — Kimi K2.7 Code开源编程 LLM 多模态• 核心能力1T 参数 MoE 架构激活 32B原生支持 256K 上下文 MoonViT 视觉编码器处理多模态输入强制开启思维链推理代码 Benchmark 提升 ~21.8%推理 Token 消耗降 30%API 同步上线高速版推理提速 5–6×。⚡ MiniMax — M3 开源原生多模态模型 MSA 稀疏注意力• 核心能力约 428B 总参数 MoE激活 23B原生融合文本/图像/视频训练自研 MiniMax Sparse Attention 使 1M 上下文推理加速 28 倍预填加速 9×、解码加速 15×长文本 Agent 门槛大幅降低权重已开源。 智谱 — GLM-5.2 开源旗舰 ZCode 3.0 Agent 编程工具• 核心能力744B MoE激活 ~40B真实可用 1M Token 长上下文强化编程与复杂任务规划配套 ZCode 3.0 切换自研 Agent 内核支持分组任务工作区与智能知识库MIT 协议开源免费商用。 小米 — MiMo Code V0.1开源 Coding Agent MiMo-V2.5 多模态模型• 核心能力终端级 AI 编程 Agent内置持久记忆 Compose 模式支持跨会话上下文与零成本迁移 Claude Code 配置内置 MiMo-V2.5 多模态模型专项适配代码理解、工具调用与任务规划。 谷歌 — DiffusionGemma开源扩散 LLM Gemini-SQL2 API• 核心能力DiffusionGemma 26B MoE激活 3.8B采用并行扩散生成 256 Token文本生成速度最高提 4×适合代码补全与行内编辑Gemini-SQL2基于 Gemini 3.1 ProText-to-SQL BIRD 基准准确率 80.04%已开放 API 预览。 智源研究院 — Emu3.5 多模态统一基座 腾讯混元 HPC-Ops 推理算子库• 核心能力Emu3.5 纯自回归统一架构原生支持文本/图像/视频理解与生成腾讯混元开源 HPC-Ops 推理算子库——Attention 动态调度长文本加速 2.95×端到端 QPM 提升 17%FusedMoE 较主流框架快 1.2–1.6×。