6 月 5 日英特尔至强 6 新品发布会暨数据中心创新日在北京举行。随着 Agentic AI智能体 AI的爆发式增长CPU 正在从 AI 算力的 “配角” 重新回归 “指挥家” 的核心位置。本次发布会不仅正式推出了专为高密度智能体场景打造的至强 6 能效核处理器更联合腾讯云、金山云、阿里云、新华三、云尖信息等数十家生态伙伴展示了从芯片到系统、从算力到安全的全栈 AI 解决方案。对于开发者和企业 IT 决策者而言这不仅是一次产品更新更是 AI 算力架构从 “GPU 独奏” 向 “全栈交响” 转型的重要信号。Agentic AI 重构算力逻辑CPU 需求迎来 5 倍爆发“如果把 AI 数据中心比作未来世界的超级工厂它的产出是 token生产机器是三台GPU 集群、CPU 集群和高性能存储集群而驱动这三台机器的都是同一个东西 —— 英特尔至强处理器。” 英特尔中国区技术部总经理高宇的这个比喻精准点出了 Agentic AI 时代算力格局的本质变化。过去几年AI 行业的焦点集中在大模型训练GPU 凭借强大的浮点运算能力成为绝对主角。但随着 AI 从被动的单轮推理转向主动的、目标驱动的智能体模式算力需求的重心正在发生根本性转移。智能体的核心工作不再是单次的模型计算而是持续的任务拆解、工具调用、数据调度和上下文管理 —— 这些恰恰是 CPU 的传统优势领域。英特尔数据中心集团副总裁兼中国区总经理陈葆立透露了一组真实的行业数据国内某领先大模型厂商的 CPU 需求在过去一年增长了 5 倍。这种增长并非来自单一环节而是全链路的每个运行中的智能体本身需要 CPU 算力支撑智能体调用数据库、API、执行代码时会产生额外的 CPU 负载甚至 KV Cache 的卸载和管理也高度依赖 CPU。腾讯云计算产品运营总监周驰从业务实践角度印证了这一趋势。他指出不能用单台服务器内的 CPU/GPU 比例来衡量需求变化而应从全球业务总量来看。以腾讯 “龙虾” 智能体的破圈为例用户群体从开发者扩展到律师、农民、老人和儿童带来了海量的自动化任务需求。“这些不是高精尖的计算而是日常琐碎的工作不需要很多 GPU更需要 CPU 的调度能力和高并发执行小脚本的能力。”云尖信息副总裁张欢军则进一步观察到随着企业级智能体的普及未来 CPU 在算力中的占比还将持续提升。“目前龙虾大多还是个人业务为主企业级 Agent 相对较少。当企业开始大规模部署数字员工时CPU 的负载量会迎来新一轮爆发。”行业数据也在验证这一判断2025 年一季度全球 AI 算力需求暴涨 417%CPU 与 GPU 的部署比例已从去年的 1:8 提升至 1:2英特尔等厂商预测这一比例未来可能达到 1:1 甚至更高。至强 6为智能体量身打造的 “高密度算力底座”面对 Agentic AI 带来的全新需求英特尔推出的至强 6 能效核处理器代号 Clearwater Forest并非临时拼凑的产品而是多年技术积累的集中释放。正如陈葆立所说“机会是留给有准备的人的至强的很多功能在智能体出现前就已经做好了只是现在终于迎来了用武之地。”288 核超高密度单颗 CPU 支撑 1000 个智能体至强 6 最核心的优势在于业界领先的核心密度。基于 Intel 18A 制程工艺它最高可集成 288 个能效核末级缓存达到 576MB较上一代提升 5 倍以上同时支持 8000MT/s 的 DDR5 内存。这种设计完美匹配了智能体 “海量并发、轻量计算” 的特点。英特尔实测数据显示至强 6 的单核可同时运行 3-4 个轻量级智能体单颗处理器即可稳定支持超过 1000 个智能体的部署。与上一代产品相比其性能密度提升高达 2.5 倍每线程每瓦性能比同类产品高出 45%。对于云厂商而言这意味着在相同的机架空间内可以部署更多的智能体实例大幅降低单智能体的运行成本。QATIAA破解 KV Cache 爆炸的 “金钥匙”随着大模型上下文窗口扩展到百万甚至数百万 tokenKV Cache 的存储需求呈指数级增长。一个 100 万上下文的用户会话仅 KV Cache 就需要 10GB 以上的存储空间这导致显存和 SSD 资源极度紧张。针对这一行业痛点英特尔重点强调了 QAT快速辅助技术和 IAA内存分析加速两大技术。QAT 通过硬件级压缩可将 KV Cache 的体积减少 50% 以上同时将首 Token 延迟提升 4 倍IAA 则实现了内存数据的实时压缩和解压在不影响性能的前提下大幅节省内存占用。“这两个技术是打开 Agentic AI 普及大门的金钥匙。” 高宇表示“现在高端 SSD 已经供不应求QAT 能帮客户节省一半的闪存需求IAA 则能让有限的内存运行更多的智能体直接降低了 AI 应用的落地门槛。”弹性架构E 核 P 核覆盖全场景需求针对智能体多样化的负载特性英特尔坚持 “大小核” 混合架构路线。至强 6 的能效核E 核适合运行大量轻量级的智能体本体和调度任务而至强 6 性能核P 核则用于处理智能体触发的高性能任务如数据库调用、SAP 系统调度等。陈葆立特别指出单一架构无法满足所有智能体场景。“当智能体只是在后台做市场调研、查询机票时E 核足够用但当它需要频繁调用数据库或执行复杂计算时就必须依赖 P 核的高性能。” 此外英特尔 CEO 已官宣超线程功能将回归客户可根据业务需求灵活开启或关闭进一步提升资源利用率。在安全性方面至强 6 首次原生支持 SM3/4 国密算法同时通过 TDX可信域扩展技术提供硬件级机密计算能力确保 AI 模型和用户数据在运行过程中 “可用而不可见”。生态共舞全产业链验证的落地能力一款芯片的成功离不开生态的支持。本次发布会上英特尔的合作伙伴们展示了至强 6 在云服务、存储、服务器硬件等多个领域的落地成果证明了其已经具备大规模商用的条件。腾讯云作为英特尔 AP 平台的全球独占合作伙伴早在 Sierra Forest 时代就开始了深度合作。腾讯云星星海产品架构师黎洁介绍搭载至强能效核的星星海服务器已成为腾讯业务的算力基石成功支撑了 QQ 红包 3 倍瞬时流量、腾讯会议 8 天扩容 100 万核等极端场景。未来腾讯云将推出基于至强 6 的新一代实例进一步提升智能体服务的性能和密度。金山云基于至强 6 推出了 SE10 实例其 AI Agent 部署密度提升 80% 以上MySQL 性能提升 52%Redis 时延降低 20%。金山云计算研发负责人杨峰表示“在 AI Agent 架构中CPU 已经从辅助角色变成了指挥者它决定了整个系统的效率和体验。”存储领域新华三推出的 AI 原生存储 X20000 与至强 6 深度协同通过 X Cache 推理加速软件将 Token 生产效率提升 10 倍以上阿里云则利用至强的 QAT 引擎将存储压缩带宽提升 400%同时减少 75% 的通用 CPU 核数。硬件方面云尖信息推出了基于至强 6 的 AP 和 SP 两大平台涵盖 1U 到 10U 全系列 20 多款服务器产品。其全液冷 CPU 集群柜单柜支持 20 万瓦功耗最高可部署 6 万个智能体满足大规模智能体集群的部署需求。可以看到英特尔正在重新定义 AI 算力的竞争维度。当行业还在比拼 GPU 的浮点算力时英特尔已经将目光投向了 Agentic AI 时代的全栈需求以至强处理器为核心构建 “算力 - 存力 - 连接力 - 保障力” 四位一体的技术体系并通过 40 年积累的生态优势将这些能力转化为可落地的解决方案。对于开发者和企业而言这意味着 AI 应用的开发和部署将更加灵活和经济。不再需要盲目追求昂贵的 GPU 集群而是可以根据业务需求合理搭配 CPU 和 GPU 资源实现最优的性价比。正如英特尔全球副总裁兼首席市场营销官 Brett Hannath 所说“AI 训练是 GPU 的独奏协奏曲但 Agentic AI 需要整个计算平台的协同交响。” 在这场交响乐中CPU 正在重新拿起指挥棒而英特尔至强 6 的发布正是这场演出的开场序曲。