首款专为大规模上下文 AI 设计的 CUDA GPU,英伟达
英伟达今日宣布推出新产品 该硬件旨在将理解 AI 提示的任务与生成响应的任务区分开,英伟达表示,这将使整个过程对客户的效率更高。
该新硬件预计将作为较大的 Vera Rubin 平台的一部分工作,该平台同时集成了 Vera CPU 和 Rubin GPU。从英伟达新闻稿获悉,独立的 Rubin CPX GPU 包含 英伟达 CEO 黄仁勋将 Rubin CPX 与 RTX 进行了比较,他说:“正如 RTX 革新了图形和物理 AI,英伟达表示,该硬件将得到其完整软件栈的支持,包括 Nemotron —— 其一系列开放的多模态模型,专为构建企业级 AI 代理而设计。Nemotron 模型提供不同尺寸,从 Nano 用于设备端应用,到 Super 用于单 GPU 设置,再到 Ultra 用于大型数据中心。
英伟达表示,预计 Rubin CPX 将于
