Grok-5/MiniMax-M3爆料!更强的模型都在路上了
Grok-5马斯克在X上发了条短消息AI圈立马热闹起来。1.5万亿参数的Grok V9-MediumGrok-5训练完成2到3周后面向公众发布参数量是现役模型的三倍大量Cursor编程数据喂进了补充训练后续还有更多。目前Grok全部生产流量跑在0.5T的V8-SmallGrok-4上1.5T参数量直接翻了三倍。模型规模跃迁到这个量级推理深度和复杂任务处理能力会跟着上一个台阶。马斯克特别提到大量来自Cursor的编程数据被加入了补充训练而且后面还有更多。Cursor是当下最火的AI编程工具年经常性收入ARRAnnual Recurring Revenue已达20亿美元三个月翻了一倍增速在SaaS软件即服务历史上排得上号。Cursor手里握着海量真实开发者的编码轨迹代码补全、重构、调试每一笔操作都是高质量训练素材。xAI拿这些数据喂模型瞄准的就是编程场景的实战表现。为什么Cursor的数据这么重要开发者用Cursor写代码、修Bug、做重构每一次交互都产生一条完整的思维链从意图理解到代码生成再到错误修正一套数据对训练编程模型的价值比单纯爬GitHub仓库高出一个维度。今年4月21日SpaceX宣布与Cursor达成合作Cursor可以使用SpaceX旗下Colossus超级计算机训练模型。SpaceX还获得了以600亿美元收购Cursor的期权不收购则为合作支付100亿美元。SpaceX有算力Cursor有数据和产品两者结合直接对准编程赛道。xAI利用Cursor的编码轨迹训练Grok基础模型和后训练的Composer模型Cursor则借助Colossus训练自家的Composer 2.5。马斯克此前公开声称Grok的编程能力好过Cursor现在又把Cursor的数据拿来做训练粮要在编码领域跟OpenAI的Codex、Anthropic的Claude Code正面对决。MiniMax-M3MiniMax的工程主管也发了一张爆料图。“有大事要发生了”全新的稀疏注意力机制。网友解读MiniMax-M3要来了预填速度提升了 9.7 倍解码速度提升了 15.6 倍。官方发布了 M2 的技术报告同时回答了人们的猜想。M2 系列终结MiniMax-M3 即将登场。参考资料https://x.com/elonmusk/status/2058787384364265734https://x.com/SkylerMiao7/status/2059285750458544561https://x.com/MiniMax_AI/status/2059473229253902516