至强 6 + 亮剑 Agentic AI 时代：英特尔如何让 CPU 重回 AI 算力 C 位？

张

张建站

2026/6/8 16:11:09

10分钟阅读

至强 6 + 亮剑 Agentic AI 时代：英特尔如何让 CPU 重回 AI 算力 C 位？

6 月 5 日英特尔至强 6 新品发布会暨数据中心创新日在北京举行。随着 Agentic AI智能体 AI的爆发式增长CPU 正在从 AI 算力的 “配角” 重新回归 “指挥家” 的核心位置。本次发布会不仅正式推出了专为高密度智能体场景打造的至强 6 能效核处理器更联合腾讯云、金山云、阿里云、新华三、云尖信息等数十家生态伙伴展示了从芯片到系统、从算力到安全的全栈 AI 解决方案。对于开发者和企业 IT 决策者而言这不仅是一次产品更新更是 AI 算力架构从 “GPU 独奏” 向 “全栈交响” 转型的重要信号。Agentic AI 重构算力逻辑CPU 需求迎来 5 倍爆发“如果把 AI 数据中心比作未来世界的超级工厂它的产出是 token生产机器是三台GPU 集群、CPU 集群和高性能存储集群而驱动这三台机器的都是同一个东西 —— 英特尔至强处理器。” 英特尔中国区技术部总经理高宇的这个比喻精准点出了 Agentic AI 时代算力格局的本质变化。过去几年AI 行业的焦点集中在大模型训练GPU 凭借强大的浮点运算能力成为绝对主角。但随着 AI 从被动的单轮推理转向主动的、目标驱动的智能体模式算力需求的重心正在发生根本性转移。智能体的核心工作不再是单次的模型计算而是持续的任务拆解、工具调用、数据调度和上下文管理 —— 这些恰恰是 CPU 的传统优势领域。英特尔数据中心集团副总裁兼中国区总经理陈葆立透露了一组真实的行业数据国内某领先大模型厂商的 CPU 需求在过去一年增长了 5 倍。这种增长并非来自单一环节而是全链路的每个运行中的智能体本身需要 CPU 算力支撑智能体调用数据库、API、执行代码时会产生额外的 CPU 负载甚至 KV Cache 的卸载和管理也高度依赖 CPU。腾讯云计算产品运营总监周驰从业务实践角度印证了这一趋势。他指出不能用单台服务器内的 CPU/GPU 比例来衡量需求变化而应从全球业务总量来看。以腾讯 “龙虾” 智能体的破圈为例用户群体从开发者扩展到律师、农民、老人和儿童带来了海量的自动化任务需求。“这些不是高精尖的计算而是日常琐碎的工作不需要很多 GPU更需要 CPU 的调度能力和高并发执行小脚本的能力。”云尖信息副总裁张欢军则进一步观察到随着企业级智能体的普及未来 CPU 在算力中的占比还将持续提升。“目前龙虾大多还是个人业务为主企业级 Agent 相对较少。当企业开始大规模部署数字员工时CPU 的负载量会迎来新一轮爆发。”行业数据也在验证这一判断2025 年一季度全球 AI 算力需求暴涨 417%CPU 与 GPU 的部署比例已从去年的 1:8 提升至 1:2英特尔等厂商预测这一比例未来可能达到 1:1 甚至更高。至强 6为智能体量身打造的 “高密度算力底座”面对 Agentic AI 带来的全新需求英特尔推出的至强 6 能效核处理器代号 Clearwater Forest并非临时拼凑的产品而是多年技术积累的集中释放。正如陈葆立所说“机会是留给有准备的人的至强的很多功能在智能体出现前就已经做好了只是现在终于迎来了用武之地。”288 核超高密度单颗 CPU 支撑 1000 个智能体至强 6 最核心的优势在于业界领先的核心密度。基于 Intel 18A 制程工艺它最高可集成 288 个能效核末级缓存达到 576MB较上一代提升 5 倍以上同时支持 8000MT/s 的 DDR5 内存。这种设计完美匹配了智能体 “海量并发、轻量计算” 的特点。英特尔实测数据显示至强 6 的单核可同时运行 3-4 个轻量级智能体单颗处理器即可稳定支持超过 1000 个智能体的部署。与上一代产品相比其性能密度提升高达 2.5 倍每线程每瓦性能比同类产品高出 45%。对于云厂商而言这意味着在相同的机架空间内可以部署更多的智能体实例大幅降低单智能体的运行成本。QATIAA破解 KV Cache 爆炸的 “金钥匙”随着大模型上下文窗口扩展到百万甚至数百万 tokenKV Cache 的存储需求呈指数级增长。一个 100 万上下文的用户会话仅 KV Cache 就需要 10GB 以上的存储空间这导致显存和 SSD 资源极度紧张。针对这一行业痛点英特尔重点强调了 QAT快速辅助技术和 IAA内存分析加速两大技术。QAT 通过硬件级压缩可将 KV Cache 的体积减少 50% 以上同时将首 Token 延迟提升 4 倍IAA 则实现了内存数据的实时压缩和解压在不影响性能的前提下大幅节省内存占用。“这两个技术是打开 Agentic AI 普及大门的金钥匙。” 高宇表示“现在高端 SSD 已经供不应求QAT 能帮客户节省一半的闪存需求IAA 则能让有限的内存运行更多的智能体直接降低了 AI 应用的落地门槛。”弹性架构E 核 P 核覆盖全场景需求针对智能体多样化的负载特性英特尔坚持 “大小核” 混合架构路线。至强 6 的能效核E 核适合运行大量轻量级的智能体本体和调度任务而至强 6 性能核P 核则用于处理智能体触发的高性能任务如数据库调用、SAP 系统调度等。陈葆立特别指出单一架构无法满足所有智能体场景。“当智能体只是在后台做市场调研、查询机票时E 核足够用但当它需要频繁调用数据库或执行复杂计算时就必须依赖 P 核的高性能。” 此外英特尔 CEO 已官宣超线程功能将回归客户可根据业务需求灵活开启或关闭进一步提升资源利用率。在安全性方面至强 6 首次原生支持 SM3/4 国密算法同时通过 TDX可信域扩展技术提供硬件级机密计算能力确保 AI 模型和用户数据在运行过程中 “可用而不可见”。生态共舞全产业链验证的落地能力一款芯片的成功离不开生态的支持。本次发布会上英特尔的合作伙伴们展示了至强 6 在云服务、存储、服务器硬件等多个领域的落地成果证明了其已经具备大规模商用的条件。腾讯云作为英特尔 AP 平台的全球独占合作伙伴早在 Sierra Forest 时代就开始了深度合作。腾讯云星星海产品架构师黎洁介绍搭载至强能效核的星星海服务器已成为腾讯业务的算力基石成功支撑了 QQ 红包 3 倍瞬时流量、腾讯会议 8 天扩容 100 万核等极端场景。未来腾讯云将推出基于至强 6 的新一代实例进一步提升智能体服务的性能和密度。金山云基于至强 6 推出了 SE10 实例其 AI Agent 部署密度提升 80% 以上MySQL 性能提升 52%Redis 时延降低 20%。金山云计算研发负责人杨峰表示“在 AI Agent 架构中CPU 已经从辅助角色变成了指挥者它决定了整个系统的效率和体验。”存储领域新华三推出的 AI 原生存储 X20000 与至强 6 深度协同通过 X Cache 推理加速软件将 Token 生产效率提升 10 倍以上阿里云则利用至强的 QAT 引擎将存储压缩带宽提升 400%同时减少 75% 的通用 CPU 核数。硬件方面云尖信息推出了基于至强 6 的 AP 和 SP 两大平台涵盖 1U 到 10U 全系列 20 多款服务器产品。其全液冷 CPU 集群柜单柜支持 20 万瓦功耗最高可部署 6 万个智能体满足大规模智能体集群的部署需求。可以看到英特尔正在重新定义 AI 算力的竞争维度。当行业还在比拼 GPU 的浮点算力时英特尔已经将目光投向了 Agentic AI 时代的全栈需求以至强处理器为核心构建 “算力 - 存力 - 连接力 - 保障力” 四位一体的技术体系并通过 40 年积累的生态优势将这些能力转化为可落地的解决方案。对于开发者和企业而言这意味着 AI 应用的开发和部署将更加灵活和经济。不再需要盲目追求昂贵的 GPU 集群而是可以根据业务需求合理搭配 CPU 和 GPU 资源实现最优的性价比。正如英特尔全球副总裁兼首席市场营销官 Brett Hannath 所说“AI 训练是 GPU 的独奏协奏曲但 Agentic AI 需要整个计算平台的协同交响。” 在这场交响乐中CPU 正在重新拿起指挥棒而英特尔至强 6 的发布正是这场演出的开场序曲。

LPC86x ADC极限速度实战：从1.9Msps理论到稳定采集的完整配置指南

1. 项目概述在嵌入式系统开发中，模数转换器（ADC）的性能往往是决定整个系统实时性与精度的关键瓶颈。无论是电机控制中的电流采样、音频处理中的信号捕捉，还是环境监测中的传感器数据读取，我们都希望ADC能跑得既快又稳。…...

2026/6/8 16:10:37 阅读更多 →

2026年9款AI面试工具全景盘点：精选测评与终极选择指南

2026年的职场环境对求职者的要求正在不断重塑。随着AI技术的全面普及，AI面试辅助工具已经从最初的“新奇玩具”，变成了求职者的“刚需装备”。在本次2026年年中的重新评估中，我们观察到了面试工具推荐市场的几个显著转向： “陪…...

2026/6/8 16:09:50 阅读更多 →

如何高效使用京东自动评价脚本：解决评论文不对题的终极指南

如何高效使用京东自动评价脚本：解决评论文不对题的终极指南【免费下载链接】jd_AutoComment 自动评价,仅供交流学习之用项目地址: https://gitcode.com/gh_mirrors/jd/jd_AutoComment 还在为京东购物后写评价而烦恼吗？🤔 每次面对空…...

2026/6/8 16:05:43 阅读更多 →

索引堆及其优化

索引堆及其优化引言索引堆是一种数据结构，广泛应用于计算机科学和软件工程领域。它主要用于解决优先队列问题，如最小堆和最大堆。本文将详细介绍索引堆的概念、实现方法以及优化策略。索引堆的定义索引堆是一种基于堆数据结构的索引机制。它通过维护一个堆来存储数据…...

2026/6/8 0:46:40 阅读更多 →

2026实测盘点｜适合国内高校生的AI写作平台，降重润色哪家强？

2026年毕业季，学术审查全面加码。教育部明确要求毕业论文AIGC率不得超过30%，985/211院校更是将红线压到了20%以内，硕士论文甚至卡到15%。与此同时，知网上线AIGC 3.0系统，可实现段落级内容溯源；维普引入语义…...

2026/6/8 4:35:49 阅读更多 →

JewelCraft：Blender珠宝设计的终极免费解决方案

JewelCraft：Blender珠宝设计的终极免费解决方案【免费下载链接】jewelcraft Blender add-on for jewelry design 项目地址: https://gitcode.com/gh_mirrors/je/jewelcraft JewelCraft是一款专为珠宝设计师和3D艺术家打造的Blender插件，提供完整…...

2026/6/8 0:52:21 阅读更多 →