英伟达 GTC 2025 要点速懂:Blackwell Ultra 芯片、人形
北京时间今天凌晨,一年一度的老黄身着皮衣、不用提词器,
一、从 GeForce 游戏显卡聊起
尽管英伟达并没有在今年的 GTC 大会上发布新的 GeForce 游戏显卡产品,但老黄依然选择从 GeForce 的 25 周年聊起。
黄仁勋强调,目前全球都已“售罄”的 RTX 5090 显卡,比前代 RTX 4090 的体积足足小了 30%。
正是
二、Agentic AI 时代
在发布新产品之前,老黄讨论了我们在 AI 时代的发展阶段。
现在我们处于生成式 AI阶段,根据路线图,我们将迈向一个 Agentic AI 时代,随后便是 Physical AI —— 机器人登场的时候。
老黄认为,AI 领域 Scaling Law 的故事还没有讲完,而且仍在加速,我们对算力的需求并没有减弱。
数据中心建设预计将在 2028 年达到 1 万亿美元。
三、自动驾驶,安全第一位
自动驾驶汽车时代已来,面对安全问题,老黄还发布了
四、Dynamo,AI 工厂的操作系统
为了让客户“买得越多、省得越多”,英伟达发布了 Dynamo,号称是Dynamo 是一个“分布式推理服务库”。本质上,它是一个针对用户需求 token 而无法生产足够 token 之间问题的开源解决方案。
黄仁勋展示了一张关于推理的图表,X 轴显示用户每秒的 Token 数,Y 轴显示工厂每秒的 Token 数。
在 Dynamo、Grace Blackwell NVLink72 超级芯片的加持下,Blackwell 相比 Hopper 而在推理模型中,这一性能差距更是
五、超大杯 Blackwell Ultra芯片
随后,老黄正式发布了之前传言已久的“超大杯”拥有 72 颗 GB300 的 Blackwell Ultra NVL72 平台将于 2025 年下半年推出,目前使用 Blackwell GB200 的客户,也都可以平滑切换到 Blackwell Ultra。
六、下一代 Rubin芯片,抢先预览
接下来,黄仁勋公布了继 Hopper、Blackwell 之后的英伟达选择以“证实暗物质存在”的女性科学先驱薇拉・鲁宾来命名,延续了该公司以杰出科学家命名芯片架构的传统。
Vera Rubin NVL144 将于 2026 年下半年推出,拥有 75TB 带宽 13TB/s 的 HBM4 内存,带来 而更强的 Rubin Ultra NVL576 将于 2027 年下半年推出,拥有 365TB 带宽 4.6PB/s 的 HBM4e 内存,带来 Rubin 的性能可达 Hopper 的 900 倍,而 Blackwell 是 Hopper 的 68 倍。
为了匹配“AI 工厂”的需求,英伟达还发布了 Spectrum-X Photonics 与 Quantum-X Photonics 而 Rubin 的下一代架构将被命名为 Feynman,用来纪念在量子力学领域作出了巨大贡献的美国物理学家理查德・菲利普斯・费曼。
七、全套 AI 计算机,任你选择
看完了上面的数据中心产品,我们再来看看老黄眼中 AI 时代的电脑应该是什么样的。
DGX Station 搭载一颗 GB300超级芯片,拥有 784GB 统一内存,之前在 CES 上发布的 Project DIGITS 迷你主机,现已正式定名为 DGX Spark,此外,英伟达还正式发布了面向工作站和服务器的 RTX PRO 系列 Blackwell 专业卡。
其中,旗舰级的 RTX PRO 6000系列拥有
八、步入机器人时代
在本次 GTC 的结尾,英伟达开始讨论机器人的相关内容。
老黄首先展示了与迪士尼和谷歌 Deepmind 团队合作打造的随后老黄宣布,英伟达 Isaac GROOT N1 ——Blackwell 芯片已经开始全面生产,Blackwell Ultra 超大杯将于今年年底登场,面向企业及个人的 AI 产品也箭在弦上,机器人具身智能时代也即将到来。
在 GTC 2025 上,英伟达传达出的一个强烈信息,简单来说便是:我们对 AI 算力的需求仍在持续加速中,