小米开源 MiMo-V2.5 系列模型:低 token 消耗,能否取代封闭前沿模型?
小米开源 MiMo 模型提供低成本选择小米发布并开源了 MiMo-V2.5 和 MiMo-V2.5-Pro 模型二者均遵循 MIT 许可协议为开发者构建能执行编码和工作流自动化等长任务的 AI 智能体提供了一个潜在的低成本选择。这两款模型都支持 100 万 token 的上下文窗口。两款模型各有侧重MiMo-V2.5 拥有 100 万 token 的上下文窗口并采用稀疏混合专家MoE设计主要面向构建自主编码和工作流智能体的开发者。MiMo-V2.5-Pro 则专为复杂的智能体和编码任务而设计而 MiMo-V2.5 是原生全模态模型可处理文本、图像、视频和音频。智能体 AI 成本压力凸显MIT 许可协议有吸引力当前智能体 AI 工作负载给企业的 AI 预算带来了新压力。这些系统在规划、调用工具、编写代码和从错误中恢复时会消耗大量 token因此成本和部署控制对开发者来说愈发重要。小米表示通过采用 MIT 许可协议允许商业部署、持续训练和微调无需额外授权。Kadence International 高级副总裁 Tulika Sheel 认为MIT 许可协议很有吸引力“它允许企业自由修改、部署和商业化该模型不受限制这在如今的 AI 领域十分罕见。”MiMo 模型测试表现出色成本控制佳小米在博客文章中称在 ClawEval 测试中MiMo-V2.5-Pro 仅使用每条轨迹约 7 万个 token就能达到 64% 的 Pass^3 准确率相比同等能力水平的 Claude Opus 4.6、Gemini 3.1 Pro 和 GPT-5.4token 消耗减少了约 40 - 60%。这两款模型采用稀疏混合专家MoE设计来控制计算成本。参数为 3100 亿的 MiMo-V2.5 每次请求仅激活 150 亿参数而参数为 10.2 万亿的 Pro 版本则激活 420 亿参数。小米还提到Pro 模型的混合注意力设计在长上下文任务中可将 KV 缓存存储减少近 7 倍。长期测试成果显著小米列举了多项长期测试结果例如 MiMo-V2.5-Pro 在 4.3 小时内通过 672 次工具调用完成了一个用 Rust 编写的 SysY 编译器通过了全部 233 项隐藏测试该模型还在 11.5 小时的自主工作中通过 1868 次工具调用生成了一个 8192 行的桌面视频编辑器。企业会采用 MiMo 吗小米的 MiMo-V2.5 系列模型能否在智能体编码和自动化工作负载方面在企业开发者中取代封闭前沿模型将取决于企业对性能、成本和风险的评估。Omdia 首席分析师 Lian Jye Su 表示“企业开发者在评估小米的 MiMo-V2.5 及其变体时应考虑总体拥有成本TCO包括 token 效率、每项成功任务的成本以及与专有模型相关的许可成本。封闭前沿模型在通用任务和最具挑战性的边缘情况上可能仍具优势但开放权重模型在大量的智能体工作中表现出色。”MiMo 可作高性价比选择Pareekh Consulting 首席执行官 Pareekh Jain 认为企业不应将 MiMo-V2.5 视为 Claude 或 GPT 的替代品而应将其作为处理高 token 工作负载的高性价比智能体模型。“关键指标不仅是准确性还有每项成功任务的 token 消耗。前沿模型在复杂编码基准测试中往往能达到更高的成功率但会产生大量推理开销。MiMo-V2.5 旨在提高 token 效率意味着它能用显著更少的输入和输出 token 取得相当的结果。”Jain 指出这使得类似 MiMo 的模型可作为重复性编码、质量保证、迁移、文档编写、测试和自动化工作负载的“经济主力”而封闭前沿模型仍将是最难任务的质量标杆。MiMo 或改变企业 AI 经济模式Gartner 高级首席分析师 Ashish Banerjee 表示像 MiMo 这样的模型可能会显著改变企业长期智能体的 AI 经济模式。“当任务涉及数百万 token 时按使用量计费的专有 API 就不再方便而更像是对迭代的一种负担。相比之下MiMo 的 MIT 许可协议、开放权重、100 万 token 的上下文窗口和相对较低的价格使私有云或自托管部署在战略上更具可行性。”不过Banerjee 也指出这并不意味着企业会放弃专有 API。“企业将继续使用专有 API 以获得前沿的准确性和低运营消耗同时将大规模、可重复的智能体工作流转向开放模型因为在这些场景中成本可预测性、数据控制和定制化更为重要。简而言之长期、大量的智能体 AI 将发展成一个混合市场像 MiMo 这样的开放模型将打破对纯 API 的依赖。”MiMo 采用或面临挑战此外Su 补充说由于源自中国的模型可能会引起受监管的西方组织的担忧MiMo 的采用可能会面临挑战。