暴雨装备:今年国内AI服务器规模大幅增长
近日暴雨金融行业部方案架构师李伟在上海金融展上接受记者采访时透露受益于智算需求的爆发式增长以及金融、互联网等行业加快建设安全可靠AI基础设施暴雨搭载国内GPU和CPU的服务器规模今年将大幅增长。生成式AI和智能体应用加速落地正在推动中国算力产业进入新一轮扩张周期。中国信通院数据显示今年一季度国内AI算力需求同比暴涨417%而供给增速仅128%。供需失衡之下算力市场正步入量价齐升期。而对安全可靠算力的需求亦在加速释放。作为国内头部算力基础设施厂商暴雨装备主营业务涵盖服务器、PC等计算产品。金融是其业务中的一个重要板块。“金融行业对安全可靠的要求很高也是安全可信路线推进最快、标准最严的领域。”李伟指出。随着生成式AI与智能体加速在金融机构的业务场景中落地行业算力需求结构正发生显著变化。信贷审批、合规审核、保险理赔等场景对算力的消耗量激增这类业务往往需调用征信信息、资产数据、监管政策等信息与数据并进行多轮推理与交叉验证单次业务流程可产生海量Token需求。除了金融行业外教育、政务、能源、交通、医疗、电信、电力、航空航天等行业也在加速推进安全可靠算力基础设施建设。作为产业链上游的服务器厂商暴雨直观感受到此轮需求的快速升温。暴雨AI产品线负责人刘伟透露“今年公司搭载国内CPU及GPU的AI服务器出货规模将显著增长实际上今年我们有机会做到更大。”刘伟称暴雨国内工厂扩建包括液冷产线扩建都在如火如荼地推进接下来全国还会进行大规模算力基础设施建设。在算力需求快速扩张的同时如何管理复杂的算力资源并以更低的Token成本将AI转化为业务能力成为需求端的新诉求。以金融行业为例当前算力消耗模式已经发生根本性改变。过去一次请求对应一次推理的短时调用而随着AI进入业务流程一个业务流程往往需要多个智能体协同、多轮推理与工具调用导致Token消耗呈链路级放大且难以预测。与此同时金融机构普遍面临多元异构算力资源分散、跨云部署调度难等痛点。一个常见的状况是总行、分行、研发中心等不同部门各自采购和管理资源导致一方面部分业务面临算力紧张而另一方面部分算力资源却处于闲置状态。“金融机构尤其是从今年开始已经完全意识到了这个问题不能再让各部门以服务器整机或卡的形式使用算力而要统一用Token这样的标准化单位像水电一样来明确计量各个部门需要多少算力资源。”李伟表示。在这一背景下暴雨推动“算力Token化”变革将GPU算力资源抽象为可计量、可调度、可计费的Token像水电一样按需分配、跨池调度。据李伟介绍目前头部金融机构已开始探索统一算力调度平台建设暴雨正在参与相关建设。相比之下中小金融机构仍处于AI应用初期阶段更多采用独立部署模式统一纳管和调度尚需时间推进。据悉从经济账来看算力Token化将帮助实现存量GPU算力利用率提升不低于20%、新购买算力成本节省不低于10%。