Anthropic新模型Claude Opus 4.7:刻意弱于Mythos背后的战略逻辑
Anthropic近日发布了新版Claude模型——Opus 4.7并有意将其能力限制在低于备受期待的Claude Mythos的水平之下。Anthropic将Opus 4.7定位为对Opus 4.6的显著升级在软件工程能力、视觉识别、记忆功能、指令遵循以及金融分析等方面均有所提升。然而尚未正式发布此前曾被意外泄露的Mythos似乎已在发布时机上盖过了Opus 4.7的风头。值得关注的是Anthropic自身也在一定程度上对Opus 4.7进行了降调处理直言其能力不及Claude Mythos Preview综合能力也相对有限。此次Opus升级也恰好发生在Anthropic推出玻璃翅计划Project Glasswing之后。该安全项目利用Claude Mythos Preview识别并修复网络安全漏洞。这在技术史上颇为罕见——一款产品的营销重点竟然在于它不能做什么而非能做什么技术分析师卡米·利维Carmi Levy表示Anthropic的表述明确说明Opus 4.7是一款更安全的模型其能力相较Mythos被刻意收窄。Anthropic着重强调Opus 4.7在指令遵循方面相比Opus 4.6有了大幅提升能够处理复杂的长期任务并能精准关注指令细节。用户反映他们已经能够将最棘手的编程工作交由该模型完成且其记忆能力也优于此前版本——它可以在多轮长期会话中记住笔记并将其应用于新任务从而减少前期的上下文输入负担。在视觉能力方面Opus 4.7拥有较前代模型高出3倍的视觉处理能力可接受最高分辨率达2576像素的图片从而支持需要精细视觉细节的多模态任务例如以智能体形式分析密集截图或从复杂图表中提取数据。此外Anthropic表示Opus 4.7还具备更强的金融分析能力可生成严谨的分析报告和模型并输出更具专业水准的演示文稿。在安全性方面Opus 4.7与前代模型大体持平在欺骗、迎合用户以及配合滥用等不良行为上的发生率较低。但Anthropic也坦承尽管该模型在诚实性和抵抗恶意提示词注入方面有所进步但在应对有害提示词等某些方面略逊于Opus 4.6行为表现尚未完全理想。Opus 4.7的发布正值外界对Claude Mythos高度期待之际。Mythos是一款通用前沿模型Anthropic称其为迄今训练过的对齐程度最高的模型。值得注意的是在今天发布的博客文章中Anthropic披露Mythos Preview在几项主要基准测试中的得分高于Opus 4.7部分项目差距超过十个百分点。具体而言Mythos Preview在SWE-Bench Pro和SWE-Bench Verified智能体编程、Humanitys Last Exam多学科推理以及智能体搜索BrowseComp等基准测试中得分更高而在智能体计算机使用、研究生级别推理和视觉推理方面两款模型表现相近。Opus 4.7现已在所有Claude产品及API中上线并支持Amazon Bedrock、谷歌云Vertex AI和微软Foundry等平台。定价与Opus 4.6保持一致输入Token每百万收费5美元输出Token每百万收费25美元。Info-Tech Research Group高级咨询分析师亚兹·帕拉尼查米Yaz Palanichamy指出Claude Opus正在业界被定位为实用型前沿模型代表着Anthropic能力最强、最智能且最具多元自动化能力的产品方向核心应用场景涵盖复杂编程、深度研究和综合性智能体工作流。他解释称该模型的核心产品差异化在于其嵌入算法的协调性与可组合性能够高效扩展多种实际应用场景。Claude Opus 4.7是一个偏技术导向的平台需要用户进行相当程度的深度个性化定制来优化提示词和输出结果。在应用工程场景方面它仍然领先于竞争对手谷歌Gemini尽管Gemini 3.1 Pro拥有更大的上下文窗口200万Token对比Claude的100万Token不过他也指出某些同类模型在原始推理能力上确实趋于接近。利维认为4.7版本的更新使Opus超越了基础聊天机器人的定位将其塑造为更接近复杂技术岗位协作助手的角色。它的能力比以往任何时候都更强对知识工作者而言是更出色的助手。与此同时其潜在风险也更低使其成为一种经过审慎权衡的折中方案。他还指出Opus 4.7的发布距Opus 4.6问世仅两个月这本身就是AI开发周期已极度过热、市场竞争白热化的信号。上周Anthropic还宣布启动玻璃翅计划将Mythos Preview应用于主动防御安全领域。该公司正与AWS、谷歌等企业及30余家网络安全机构合作推进该计划并声称已借助该计划发现数千个高危漏洞涵盖所有主流操作系统和浏览器。Anthropic有意对Claude Mythos Preview的发布范围加以限制计划先在能力相对较弱的模型上测试新的网络安全防护机制。Opus 4.7便是其中之一其网络安全能力不及Mythos。事实上Anthropic坦言在训练过程中曾刻意进行实验以有差别地削减这部分能力。Anthropic解释称Opus 4.7内置了安全防护机制可自动检测并拦截疑似涉及违禁或高风险网络安全用途的请求相关经验将在未来应用于Mythos模型。这在某种程度上是一种承认——新模型在某些方面是被刻意降智处理的目的是强化其网络风险检测与拦截能力利维评论道。从营销角度看这使Anthropic得以将Opus 4.7定位为能力与风险之间的理想平衡点同时又避开了限量发行的高端模型所带来的网络安全包袱。利维认为Mythos或许正是推动Opus 4.7大规模普及的终极垫脚石。即便Mythos最终未能公开发布它也将作为一种理想的衬托手段将Opus塑造为对大多数企业决策者而言最具平衡价值的模型。帕拉尼查米对此表示认同并指出Opus 4.7可以充当一个面向公众的测试样本用于实时检验和优化自动化网络安全防护机制而这些机制最终将成为更高级别Mythos类前沿模型全面发布的必要前置条件。QAQ1Claude Opus 4.7相比Opus 4.6有哪些主要提升AOpus 4.7在多个方面实现了升级指令遵循能力大幅提升能处理复杂长期任务视觉能力提升至前代3倍支持最高2576像素图像可完成密集截图分析等多模态任务记忆能力增强能在多轮会话中记住笔记并应用于新任务金融分析能力更强可生成更严谨的分析报告和专业演示文稿。软件工程能力也有显著提升用户可将复杂编程工作直接交由其完成。Q2Anthropic为什么要刻意限制Opus 4.7的能力让它弱于MythosAAnthropic的核心考量是安全性与风险控制。公司希望先在能力相对较弱的模型上测试并完善网络安全防护机制再将这些经验应用于更强大的Mythos。Opus 4.7在训练阶段被有意削减了部分网络安全相关能力并内置了自动检测和拦截高风险请求的防护措施。这也让Anthropic可以将Opus 4.7定位为能力与安全之间经过审慎权衡的折中方案适合企业大规模部署。Q3Claude Mythos什么时候会正式发布A目前Anthropic尚未公布Mythos的正式发布时间表。Mythos此前曾被意外泄露当前仅以Mythos Preview的形式有限使用主要用于玻璃翅计划等安全项目。Anthropic表示公司正在通过Opus 4.7等模型积累安全防护经验并将其作为Mythos更广泛发布的前置条件。部分分析师甚至认为Mythos有可能永远不会完全对公众开放。