6月12日MiniMax正式开源新一代原生多模态旗舰模型M3。沐曦股份曦云C系列GPU凭借全栈自研的软硬一体技术优势完成对M3的Day 0深度适配成为率先支持该模型的国产算力平台持续领跑国产GPU极速适配赛道。这是近期继M2.5、M2.7之后曦云C系列又一次对MiniMax旗舰大模型实现极速适配。此次Day 0适配的快速实现持续源于沐曦股份自研GPU硬件MXMACA全栈软件的软硬一体核心优势。曦云C系列GPU基于沐曦自主核心GPU IP打造具备高能效比与高通用性精准匹配大模型的超大规模参数处理及长上下文推理需求。MXMACA软件栈作为连接硬件算力与上层应用生态的核心枢纽全链路覆盖底层驱动、用户态接口、MXCC编译器、算子深度适配及主流训练/推理框架对接原生兼容 PyTorch、TensorFlow、vLLM与SGLang等 40 余种主流 AI 框架支持 500 AI 模型稳定运行大幅缩短传统模型适配周期。曦云C系列GPU依托沐曦自研MXMACA软件栈的深度优化能力成功实现M3的高效部署与稳定运行为其前沿能力提供澎湃算力支撑。在国产GPU Day 0适配赛道沐曦股份持续保持行业领先地位。截至目前沐曦已累计完成Day 0适配模型达26个全面覆盖MiniMax、智谱、阿里千问、阶跃星辰、百度、DeepSeek等国内头部厂商的最新旗舰模型品类涵盖语言、多模态、OCR、文生图、3D生成等全领域构建起模型发布—芯片适配—产业落地的高效闭环。关于MiniMax新一代原生多模态旗舰模型M3MiniMax M3 在编程和智能体等专业任务上达到了前沿的能力。它使用了全新注意力架构 MSA MiniMax Sparse Attention最高支持 1M 超长上下文。它也是一个原生多模态模型支持图片和视频的输入并能操作电脑桌面。这三种能力是海外闭源前沿模型所必须拥有的。M3 是国内第一个齐备这些要素的模型也是目前唯一的开源模型。在 Artificial Analysis 综合智能指数排行榜上M3 取得了全球开源模型的最高排名。MSA结构创新带来 Context ScalingMSA 是一个简洁且易于扩展的全新稀疏注意力架构让 context 真正成为又一个可被 scale 的维度。稀疏注意力机制普遍通过增加一个初筛阶段来避免复杂度爆炸问题。与 DSA 和 MoBA 等方案相比MSA 可以更精确为 KV 分块实现更高的有效上下文覆盖。同时MiniMax团队还在算子层直接优化采用以 KV 块为外层来聚合命中 query 的 KV outer gather Q。每块只读一次、访存连续在 M3 的 head 配比下计算访存比显著优于通行方法比开源的 Flash-Sparse-Attention、FlashMoBA 快 4 倍以上。简洁可扩展、易于实现且硬件友好的特点使它的理论收益能真正落地在 100 万上下文下M3 每 token 计算量仅为上代模型的 1/20。在 prefilling 阶段MiniMax团队实现了超过 9 倍的加速倍率在 decoding 阶段有超过 15 倍的加速优势。而且在多个对照实验中MSA 的绝大部分能力与全注意力打平。前沿的Coding和Agentic能力Coding 与 Agent 能力是 M3 重点提升之处在涵盖软件工程、终端执行等多个维度的国际权威评测中M3 均达到国际领先水平下一代 Agent Coding 比的不仅是代码生成更要比拼长期协作能力、规划能力以及人与 Agent 的协同效率。M3 把真正对 Coding 和 Agent 至关重要的数据 Scale up目标不仅是在 Benchmark 上取得领先更是在真实研发流程中成为开发者可靠的协作伙伴。多模态原生训练继续 ScaleM3 是一个从 Step 0 开始进行多模态混合训练的模型。这种原生多模态的路线能让不同模态数据的语义空间更天然、更高度的融合。同时在数据配比和构成上MiniMax团队的大量实验显示Interleaved data交错数据对模型性能带来的提升比一般认为的更加关键。这些文本和图像或其他模态在序列中交替自然排列的数据对于整体训练数据的规模扩展也很重要。在MiniMax团队为这些数据重构整套数据管线后已可以将训练数据 Token 规模提升至更大量级。模型API 调用指南http://platform.minimaxi.com/docs/api-reference/api-overview模型体验链接及开源地址https://huggingface.co/MiniMaxAI/MiniMax-M3欢迎前往沐曦开发者社区Day 0版块获取推理镜像https://developer.metax-tech.com