AMD 发布10亿开源 AI 模型 OLMo,用Instinct MI250 GPU集

2024-11-08 11:06:43

  AMD 公司于 10 月 31 日发布博文,AMD OLMo 模型使用从零开始训练的 10 亿参数语言模型系列,在 AMD Instinct™ MI250 GPU 集群上训练,使用了超过 1.3 万亿个 tokens 进行预训练,让模型在处理自然语言任务时具有强大的推理能力。

  援引新闻稿,OLMo 模型采用解码器架构,并通过下一个标记预测进行训练,这种架构在生成文本和理解上下文方面表现出色。

  与其他同类开源模型相比,AMD OLMo 在推理能力和聊天能力上表现优异。尤其是在多个基准测试中,其性能与最新的 OLMo 模型相当,且计算预算仅为其一半。

  OLMo 除数据中心使用外,更支持配备 NPU的 AMD Ryzen AI PC 能够部署模型,使开发者能在个人设备提供 AI 功能。

  AMD OLMo 是完全开源的,这意味着其他开发者和公司可以自由使用和修改这些模型,这让其成为希望探索 AI 技术替代方案的企业的一个可行选择。

下一篇:新款凯迪拉克 XT6 开启预售:限时一口价 34.99 万
上一篇:苹果 2024 款 MacBook Pro 开售:首发 M4 Max 芯片,1
返回顶部小火箭