AMD 推出自家首款小语言模型“Llama-135m”

2024-09-29 18:30:05

  AMD在 Huggingface平台公布了自家首款“小语言模型”AMD-Llama-135m,该模型具有推测解码功能,拥有6700亿个token,据介绍,这款模型主打“推测解码”能力,其基本原理是使用小型草稿模型生成一组候选token,然后由更大的目标模型进行验证。AMD表示,这款模型在四个AMD Instinct MI250节点训练了六天,其“编程专用版本”变体AMD-Llama-135m-code则额外耗费了四天时间进行微调。

下一篇:马歇尔 WILLEN II 便携式音箱开售:17 小时续航,
上一篇:荷兰警方绝大多数雇员姓名、工作联系方式遭黑
返回顶部小火箭