全流程昇腾平台训练,华为推出准万亿参数盘古

2025-05-30 17:54:03

  华为今日推出据了解,盘古团队提出 Depth-Scaled Sandwich-Norm稳定架构和 TinyInit 小初始化的方法,在昇腾平台上实现了在训练方法上,华为团队首次披露在昇腾 CloudMatrix 384 超节点上打通大稀疏比 MoE 强化学习后训练框架的关键技术,使 RL 后训练进入超节点集群时代。

  在 5 月初发布的预训练系统加速技术基础上,在不到一个月的时间内,华为团队又完成了一轮迭代升级,包括:适配昇腾硬件的自适应流水掩盖策略,进一步优化算子执行序,进一步降低 Host-Bound 以及提升 EP 通信的掩盖;自适应管理内存优化策略的开发;数据重排实现 DP 间 Attention 负载均衡;以及昇腾亲和的算子优化,这些技术实现附技术报告:点此前往及项目文件预览:点此前往

下一篇:小米·中国汽车耐力锦标赛-成都站明日开赛,S
上一篇:马斯克放豪言:特斯拉人形机器人明年搭星舰去
返回顶部小火箭