6月23日小米MiMo开放平台宣布延长MiMo-V2.5-Pro-UltraSpeed模型的体验期限因申请量远超预期。该模型输出速度超1000 tokens/s价格有优势。体验延期原因MiMo-V2.5-Pro-UltraSpeed模型6月9日上线原体验窗口到6月23日。但截至该日收到超6.6万个使用申请涵盖多领域申请者有世界500强、行业头部企业和个人开发者所以团队决定延长开放时间。模型突出优势这一模型由小米MiMo与AI推理系统团队TileRT联合推出首次在万亿参数旗舰模型上突破1000 tokens/s输出速度峰值约1200 tokens/s还支持100万token超长上下文。实现路径不依赖专用硬件通过模型和系统侧协同优化达成。优化实现路径模型侧采用FP4混合量化降低模型体积和访存压力引入DFlash投机解码提升效率。系统侧TileRT定制编译引擎与计算核减少算子启动和同步开销。底层模型已在Hugging Face开源许可证为MIT。定价极具竞争力UltraSpeed API限时体验价是标准版MiMo-V2.5-Pro的3倍却有近10倍输出速度提升。其输出定价约18元/百万tokens远低于Anthropic的Claude Opus。行业影响与反响在行业中1000 tokens/s的速度冲击力大远超GPT-5.5等。在海外开发者社区引发强烈反响不过也有人对“万亿参数”可比性存疑。编辑观点小米MiMo模型的速度和价格优势显著有望在大模型领域占据一席之地后续发展值得关注。