百度全面升级百舸 AI 异构计算平台 4.0、千帆大模

2024-09-25 18:21:11

  2024 百度云智大会今日在北京召开,百度在大会上宣布全面升级百度智能云事业群总裁沈抖表示:“2024 年大模型的产业落地正在加速,目前在千帆大模型平台上,

  升级百舸 4.0

  为满足企业落地大模型从集群创建、开发实验,到模型训练、推理的全旅程算力需求,

  集群创建阶段:百舸 4.0 预置了主流的大模型训练工具,能够实现工具层面的秒级部署,并将万卡集群运行准备时间从几周缩减至 1 小时。 开发实验阶段:企业需要针对业务目标对不同架构、参数的模型进行多次测试,进而制定最佳模型训练策略,保障后续训练的性能和效果。百舸 4.0 全新升级的可观测大盘,能够对多芯适配、集群效能、任务自动容错等方面进行全方位监测。 模型训练阶段:百舸 4.0 能够自动筛查集群状态,并基于对 GPU 故障的预测,及时转移工作负载,降低故障发生频次。此外,百舸故障秒级感知定位、Flash Checkpoint 模型任务状态回滚等技术,能够减少集群故障处置时间。

  百度官方表示,目前百舸在万卡集群上实现了在模型推理环节,百舸则通过架构分离、KV Cache、负载分配等一系列加速方法,实现了模型推理的降本提效,尤其在长文本推理方面,百舸 4.0 号称已经构建了十万卡级别的超大规模无拥塞 HPN 高性能网络、10ms 级别超高精度网络监控,以及面向十万卡集群的分钟级故障恢复能力。

  为了满足企业客户对模型调用、模型开发、应用开发的需求,百度智能云发布

  模型投入使用后,千帆平台还支持企业将应用中产生的数据,经过采样评估、人工标注、对齐或微调等方式反馈给模型,形成数据飞轮。

  此外,本次大会还发布了智能化低代码应用开发平台“AI 速搭”,

  为了满足企业直接选购成熟 AI 应用的需求,百度智能云面向数字人、智能客服、代码提效,升级了三大 AI 原生应用产品,汇总升级内容如下:

下一篇:中国信通院:8月国内手机出货量2404.7万部,5G手
上一篇:微信支付:刷掌服务不存在任何形式的加盟或代
返回顶部小火箭