字节跳动豆包大模型团队开源MoE架构优化技术,

2025-03-10 18:28:41

  字节跳动豆包大模型团队官宣开源一项针对 MoE架构的关键优化技术,早前豆包团队发布了新一代稀疏架构 UltraMem,将模型推理成本砍掉 83%,此次,又开源了 COMET,向模型训练成本出手。

  目前,COMET 核心代码已开源,并计划兼容 Triton 等编译生态。

  论文链接:

  开源地址:

下一篇:联想“拯救者战术移动固态硬盘”开售,配 1TB
上一篇:苹果悄悄撤下iPhone 16“AI Siri”广告,曾承认开发
返回顶部小火箭