踏向机架级AI基建纪元!强强联手天弘科技打造
重磅宣布将与天弘科技进行深度合作,将对标英伟达NVL72机架级AI平台的AMD全新的Helios机架级AI算力基础设施平台推向全球AI数据中心市场。对于力争在规模高达万亿美元的AI核心算力集群领域不断蚕食英伟达高达90%份额的AMD而言,Helios对于AMD创收与利润前景而言可谓至关重要,AMD逐渐将竞争重心抬升到类似英伟达NVL72那样的整机柜级系统,其2026年底大规模推出的Helios AI算力集群,本质上是在和英伟达的“机架级AI基础设施”正面交锋。
两家公司在一份AMD Helios是一整套高性能、开放标准的AI机架级基础设施平台,专为AI数据中心超大规模AI训练与推理任务而设计。机架级AI架构是一种当前最流行的集群式计算方式,在这种算力模式中,整个机架而非单台CPU/GPU服务器,作为天量级别AI工作负载的基础运算单元。它将AI GPU/AI ASIC等核心计算能力、高性能网络架构以及液冷单元整合进一个单一的AI算力基础设施系统,以高效训练大语言模型或者完成天量基于大模型的AI工作负载。
两家公司还表示,这些纵向扩展交换机将采用最先进架构的网络芯片,以实现下一代AMD Instinct MI450 系列AI GPU彼此之间的高速互连体系,从而提供针对大规模AI算力基础设施集群革新式优化的尖端计算能力。
“Helios机架级AI解决方案代表着AI算力基础设施的一种全新蓝图,使客户们能够以部署下一代无比庞大的AI工作负载所需的性能、效率和灵活性综合指标来大规模部署AI数据中心。”AMD 数据中心解决方案事业部执行副总裁兼总经理Forrest Norrod在两家公司指出,它们正在合作支持Helios在云计算平台、企业组织和大型科研环境中的一键式高效率部署。得益于双方共同合作推进Helios产能爬坡的最新动态,周一美股收盘,Celestica 股价上涨约3%,AMD股价一度上涨超3%,最终收涨1.7%。
据了解,AMD Helios机架级AI算力基础设施预计将于2026年底向微软、亚马逊等大型云计算客户们批量供货。
AMD与Celestica携手加速将Helios机架级AI平台推向市场之际,正值AMD与多家科技领军者们联手对抗英伟达所主导的垂直一体化AI算力基础设施解决方案。此前AMD宣布携手慧与科技、博通,旨在为高性能计算集群以及大型AI数据中心大规模供给开放式且机架级人工智能算力基础设施,并力争加速推动全球“主权AI”研究进展。
慧与科技将成为首批采用AMD“Helios”机架级AI算力集群架构的系统供应商之一,并且AMD和慧与科技将在与ASIC兼高性能网络基础设施领军者博通深度合作的基础上,集成一款定制化打造的HPE Juniper Networking机架内高性能扩展交换机。该大型人工智能算力系统旨在简化更大规模AI算力基础设施集群的部署,以及提供英伟达Blackwell系之外的更具性价比与能效比的AMD机架级别AI算力集群方案。
Helios本质上就是AMD对标英伟达 Blackwell NVL72/GB200 NVL72 这一路线的机架级 AI 基础设施。 两者都是把72颗GPU+CPU+高速互连+ 液冷+机架级系统工程作为AI工作负载的基础单元,而不是再把单台服务器当作核心产品。AMD官方把Helios定义为基于OCP Open Rack Wide 的开放式机架架构,面向大规模训练与推理;英伟达则把GB200 NVL72定义为由36颗 Grace CPU + 72颗 Blackwell GPU组成的液冷机架级平台。换句话说,Helios 不只是“另一批 MI450 GPU”,而是AMD第一次真正拿整柜系统去和英伟达的NVL72体系正面交锋。
相较AMD前代AI GPU系列产品,Helios 的性能跃迁是非常大。AMD官方基准写得很直接:Helios 相比上一代AMD AI算力平台可实现 最高 36倍性能提升,这也说明AMD的AI算力基础设施思路已经从“卖更强性能的GPU单卡”转向“卖整柜AI工厂”,也就是把 GPU、CPU、NIC、液冷、网络拓扑和ROCm一起打包成整套AI算力解决方案进行出售。
Helios 最大卖点是内存与开放互连。AMD 官方口径显示,72-GPU的Helios 可提供最高2.9exaFLOPS FP4、1.4 exaFLOPS FP8、31TB HBM4、1.4PB/s 聚合内存带宽、260TB/s scale-up 互连带宽;对照英伟达GB200 NVL72,Helios 在内存容量、原始scale-up 带宽和开放式机架设计上明显更激进,对长上下文、大参数模型和带宽敏感型训练/推理系统而言更具有吸引力;AMD 甚至公开声称,Helios内存容量比英伟达的下一代算力平台——即Vera Rubin系统高50%。
AMD 之所以需要联手天弘科技,原因很现实,那就是机架级AI系统的瓶颈已经不只在GPU,而在高速 scale-up 交换机、液冷整机工程、制造良率、交付能力和供应链韧性。
AMD官方在Celestica是一家总部位于加拿大的电子制造服务与基础设施解决方案提供商,它不仅从事传统的硬件组装,还在设计、制造和集成AI数据中心基础设施相关产品方面扮演关键角色;随着云服务商和大型科技公司大规模建设AI数据中心,对高速网络连接、定制硬件及机架级集成解决方案的需求大幅提升。Celestica正是这些大型数据中心所需高性能网络交换机、服务器、ASIC/TPU相关硬件模组及集成服务的核心供应商。该公司股价2025年全年涨幅高达220%。
