小米深夜认领榜一神秘大模型，MiMo-V2-Pro重磅发布！雷军直言：已超马斯克的Grok

张

张建站

2026/7/2 19:43:19

10分钟阅读

小米深夜认领榜一神秘大模型，MiMo-V2-Pro重磅发布！雷军直言：已超马斯克的Grok

整理 | 屠敏出品 | CSDNIDCSDNnews上周在全球最大的大模型 API 聚合平台 OpenRouter 上一款代号为 Hunter Alpha 的神秘模型调用量一路飙升至榜首迅速成为圈内热议的焦点。在外界还在猜测这个“幕后玩家”究竟是谁时答案很快揭晓——今天小米正式出面认领并发布了这款模型的真实身份MiMo-V2-Pro。此外其还推出了相关系列模型 MiMo-V2-Omni 和 TTS。这款模型一亮相就直接把关注度拉满万亿参数规模性能对标 GPT-5.2 和 Claude Opus 4.6而通过自有 API 调用的成本却压到对手的约六分之一到七分之一。此项目由小米 AI 实验室大模型团队负责人、前 DeepSeek R1 核心成员罗福莉领衔她将这次发布形容为一次“悄无声息的伏击”。随即雷军也在微博发文确认小米上周在 OpenRouter 匿名发布的 MiMo‑V2‑Pro 不仅快速登顶日榜如今更是成为周榜第一。MiMo‑V2‑Pro 登场直接生成很多人对大模型的印象还停留在陪人聊天、写文案、答问题。但 MiMo‑V2‑Pro 从设计之初就走向了另一条路径。它的能力不再局限于“回答问题”、“生成 Demo”而是被打造为 Agent 时代的执行中枢。换句话说它更像复杂系统的“中央大脑”可以直接参与代码生成、终端执行、长流程任务规划甚至多智能体协同与企业级知识处理。在罗福莉的描述中这是“小米首个真正为 Agent 时代构建的全栈模型体系”。小米对它的定位也很明确不只是工具而是要成为驱动各类系统与工作流的底层核心在真实生产环境中持续产生价值。此次发布之际小米也晒出了 MiMo-V2-Pro 的一些成果其已经不只是“能生成代码”而是更接近“直接交付成品”。譬如让 MiMo-V2-Pro 用 Three.js 或 Babylon.js 开发一款 3D 塔防游戏得到的结果如下此外当模型被要求复刻一种带有 1990 年代印刷杂志风格的网页设计标题使用衬线字体正文采用等宽字体整体采用多栏排版版式还刻意带有不对称结构和“出血”效果图片带有褐色滤镜与颗粒噪点页面切换模拟翻页效果导航被设计成类似杂志目录的样式每一项带编号并在悬停时放大底部则还原为类似“出版信息”的版块甚至包含虚构的 ISSN 号。在这样的复杂提示下MiMo-V2-Pro 能够一次性生成结构完整、风格统一的网页而不仅仅是零散片段整体更接近可直接使用的成品。万亿参数模型揭晓不过“智能体时代”的核心挑战是在海量数据范围内保持高保真的推理能力同时避免因延迟或成本带来的“智能税”。根据官方介绍MiMo-V2-Pro 通过稀疏架构来应对这一问题。虽然该模型的总参数达到 1 万亿但在实际运行时单次仅激活 420 亿参数规模约为 MiMo-V2-Flash 的 3 倍。底层架构设计上其效率来自进化后的混合注意力机制。传统 Transformer 在上下文增长时计算复杂度呈平方级上升而 MiMo-V2-Pro 采用 7:1 的混合比例较 Flash 版本的 5:1 有所提升来管理高达 100 万 token 的上下文窗口。这一设计让模型在处理长时任务时依然能够保持“深度记忆”而不会出现性能明显下降。此外模型还结合了轻量级的 MTP 多 token 预测层使其能够同时预测多个 token大幅降低智能体工作流中“思考阶段”的延迟。罗福莉表示这些结构性设计早在数月前就已确定目的是在行业突然转向智能体时获得“结构性优势”。MiMo-V2-Pro 位列全球第八国内第二在具体性能表现维度根据小米官方分享的基准测试结果显示MiMo-V2-Pro 在主流智能体基准测试中表现出色。其编码能力超越了 Claude 4.6 Sonnet通用智能体性能ClawEval接近 Opus 4.6。工具调用稳定性和准确率也得到了显著提升。此外据第三方机构 Artificial Analysis 的评测显示MiMo-V2-Pro 拿下全球第八国内第二的好成绩。从细分维度来看➤ MiMo-V2-Pro 在 Artificial Analysis 智能指数中得分 49仅次于 GLM-5推理版50 分高于 Kimi K2.547 分和 Qwen3.5 397B A17B45 分。在综合榜单中排名第 10位于 GPT-5.2 Codex49 分之后、Grok 4.20 Beta48 分之前。➤ 在 GDPval-AA面向真实世界任务的智能体基准中MiMo-V2-Pro 以 1426 Elo 领先同类模型包括 GLM-51406、Kimi K2.51283和 Qwen3.5 397B A17B1209。相比之下GPT-5.4 和 Claude Sonnet 4.6 的 Elo 分别为 1667 和 1633。➤ 凭借较低的幻觉率MiMo-V2-Pro 在 AA 全知指数Omniscience Index中获得 5领先 GLM-52、Kimi K2.5-8和 Qwen3.5-30。不过Claude Opus 4.614和 Gemini 3.1 Pro Preview33仍然更高。➤ 在 token 使用效率方面MiMo-V2-Pro 更加精简完成整套评测仅使用 7700 万输出 token显著低于 GLM-51.09 亿和 Kimi K2.58900 万。如果说接近第一梯队的性能是惊喜那么同样让人惊讶的还有它的成本。成本仅为主流竞品的六分之一到七分之一Artificial Analysis 实测数据显示MiMo-V2-Pro 运行整套智能指数测试仅需 348 美元按输入 $1 / 输出 $3 每百万 token 计费。尽管得分仅比 GLM-5 低 1 分但成本更低。相比之下GPT-5.2 约为 2304 美元Claude Opus 4.6 约为 2486 美元。同样的任务小米模型的成本仅为这些主流竞品的六分之一到七分之一。与此同时小米为 MiMo-V2-Pro 制定了极具攻击性的定价策略MiMo-V2-Pro≤256K每百万输入 tokens 1 美元每百万输出 tokens 3 美元MiMo-V2-Pro256K–1M每百万输入 tokens 2 美元每百万输出 tokens 6 美元缓存读取Cache read低档为每百万 tokens 0.20 美元高档为每百万 tokens 0.40 美元缓存写入Cache write暂时免费0 美元相较其他领先前沿模型小米的这种定价策略也直接打破了“顶级大模型极高成本”的行业惯例让中小企业、普通开发者都能用上接近 GPT‑5.2 水平的 AI 能力。显然小米的这一策略明显意在抢占开发者市场推动高强度应用场景的落地。罗福莉揭晓 MiMo‑V2‑Pro 落地的背后思考MiMo‑V2‑Pro 的横空出世离不开核心负责人罗福莉。对于这次发布罗福莉也在 X 平台上分享了这款新模型训练的过程与自己的思考她表示「这个万亿参数的基础模型几个月前就已经启动训练最初的目标是提升长上下文推理效率。Hybrid Attention 带来了真正的创新但又不过度激进结果证明它恰好成为 Agent 时代的理想基础支持 100 万上下文窗口结合 MTP 推理实现超低延迟与成本。这些架构选择并不是追逐热点而是我们在需求真正爆发前就构建好的“结构性优势”。真正改变一切的是第一次体验复杂的 agentic scaffold——我更愿意称之为“编排后的上下文”orchestrated context。那一刻非常震撼。第一天我就试图说服团队去用但没人买账。于是我下了一个硬性要求MiMo 团队里如果第二天对话数少于 100 次可以直接离开。结果证明这一招奏效了。一旦团队真正理解了 Agent 系统的潜力这种想象力就会直接转化为研究速度。很多人问我们为什么能推进这么快。我在做 DeepSeek R1 时就亲身经历过可以简单总结为— 基础模型和基础设施研究周期很长需要在一年前就建立战略判断— 后训练阶段则完全不同更依赖产品直觉驱动评估迭代节奏更快也更容易捕捉范式变化— 而始终不变的是好奇心、敏锐的技术直觉、果断执行、全情投入以及一个常被低估的因素对你正在构建的世界发自内心的热爱我们会开源——等模型足够稳定、真正“配得上”开源的时候。」雷军Mimo-V2-Pro 超过了 xAI Grok在模型推出的第一时间雷军也亲自站台发文庆贺道“在全球大模型综合智能排行榜 Artificial Analysis 上Mimo-V2-Pro 位列全球第八。按大模型品牌来排名排在全球第五超过了 xAI Grok。我们模型刚刚完成未来一段时间还会快速迭代增强。小米在 AI 领域上相对比较低调实际进展可能比大家看到的要快很多。”同时他还透露在 AI 领域小米今年的研发和资本投入就将超过 160 亿元。对全球 AI 行业而言小米发布 MiMo‑V2‑Pro远不止是推出一款新模型它更像一个信号AI 正在从“会说话”走向“能做事”。从性能到成本从架构到定位小米试图回答一个更本质的问题——在智能体时代模型到底应该如何参与世界而 MiMo-V2-Pro只是这个方向的起点。如果说过去的竞争是“谁更会对话”那么接下来的竞争可能会变成——谁更能行动。来源https://mimo.xiaomi.com/mimo-v2-prohttps://weibo.com/u/1749127163https://x.com/_LuoFuli/status/2034379957913129140https://x.com/ArtificialAnlys/status/2034239267052896516https://venturebeat.com/technology/xiaomi-stuns-with-new-mimo-v2-pro-llm-nearing-gpt-5-2-opus-4-6-performance推荐阅读硅谷直击黄仁勋携英伟达帝国入局龙虾大战打造万亿美元 Agent 应用经济推理算力需求暴涨万倍不想给2.5亿美元巨额奖金CEO后悔签下“软弱”合同让ChatGPT当军师解雇游戏主创并欲夺权惨败诉引全网热议Claude 5天重写老库引全网争议维护者擅自更换开源协议退网15年原作者突然现身不准改【活动分享】“48 小时与 50 位大厂技术决策者共探 AI 落地真路径。”由 CSDN 与奇点智能研究院联合举办的「全球机器学习技术大会」正式升级为「奇点智能技术大会」。2026 奇点智能技术大会将于 4 月 17-18 日在上海环球港凯悦酒店正式召开大会聚焦大模型技术演进、智能体系统工程、OpenClaw 生态实践及 AI 行业落地等十二大专题板块特邀来自BAT、京东、微软、小红书、美团等头部企业的 50 位技术决策者分享实战案例。这不仅是一场技术的盛宴更是决策者把握 2026 AI 拐点的战略机会。

软件工程小白必看：从零理解软件危机与生存周期（附张海藩教材重点解析）

软件工程入门指南：从危机认知到生存周期实战解析引言：当代码遇见现实想象一下，你正指挥一支施工队建造摩天大楼，却没有设计图纸、没有进度安排、甚至对最终要建多高都模糊不清——这就是许多软件项目起步时的真实写照。软件工程…...

2026/7/1 7:42:43 阅读更多 →

破局“研发孤岛”：构建企业级数字化研发平台的终极实战指南与架构演进（PPT）

导读：在“数字中国”战略纵深推进的宏大背景下，企业数字化转型已进入“深水区”。作为创新引擎的研发部门，正面临着前所未有的挑战：需求响应滞后、工具链割裂、数据资产沉睡、质量内建缺失。传统的“作坊式”研发管理模式已无法适…...

2026/6/26 8:03:45 阅读更多 →

3步突破硬件限制：老旧Mac系统焕新体验全攻略

3步突破硬件限制：老旧Mac系统焕新体验全攻略【免费下载链接】OpenCore-Legacy-Patcher 体验与之前一样的macOS 项目地址: https://gitcode.com/GitHub_Trending/op/OpenCore-Legacy-Patcher 问题诊断：老旧Mac的"系统停更"困境 2008-2…...

2026/7/2 20:52:13 阅读更多 →

2026四级英语考试备考|英语四六级考试材料|英语四六级备考资料

2026四级英语考试备考|英语四六级考试材料|英语四六级备考资料资料全科都有英语四六级备考资料 PDFhttps://tool.nineya.com/s/1jpf2t49o 【英语真题】1. "Comprehension" most probably means（ ） A. 理解 B. 表达 C. 翻译 D. 写作答案&#…...

2026/7/1 12:39:34 阅读更多 →

2026年英语四级|2026年大学四级英语备考资料|2026四级备考

2026年英语四级|2026年大学四级英语备考资料|2026四级备考资料全科都有2026四级备考 PDFhttps://tool.nineya.com/s/1jpf2t49o 【英语真题】1. "Vocabulary" most probably means（ ） A. 词汇 B. 语法 C. 阅读 D. 听力答案：A 解析&…...

2026/7/2 16:29:59 阅读更多 →