英伟达发布Llama Nemotron系列开放推理AI模型
英伟达最新发布 Llama Nemotron 系列开放推理 AI 模型,支持“智能体 AI”系统,Llama Nemotron 系列开放推理 AI 模型共有 Nano、Super 和 Ultra 三种规模,援引博文简单介绍如下:
Nano:专为 PC 和边缘设备设计,提供高精度推理。
Super:单 GPU 部署,兼顾顶级准确率与处理速度。
Ultra:多 GPU 服务器优化,确保复杂任务的最高精度。
三种不同规模适用于不同部署环境,可按需激活深度推理模式,简化任务时节省算力,降低推理成本。Llama Nemotron 系列开放推理 AI 模型还通过 NVIDIA NIM 微服务,支持从数据中心到边缘计算的全场景应用。
英伟达还介绍了 Cosmos Nemotron 新成员,这是专注