百度发布自研模型MuseSteamer：一张图可生成电影级

2025-07-02 17:28:52

　　百度商业研发团队发布自研生成模型“MuseSteamer”及创作平台“绘想”，MuseSteamer 是全球首个实现中文音一体化生成的模型。该技术可实现画面与音效、人声台词的协同创作，打破传统 AIGC “先画面后配音”的割裂流程。

　　据悉，MuseSteamer 在权威榜单 VBench I2V 中以 89.38% 总分登顶全球第一，支持一张图生成 10 秒 1080p 电影级画质，人物微表情与运镜效果达专业影视水准。其核心能力源于亿级中文多模态数据清洗、精细化结构化描述语言，以及多目标强化学习等技术优化。

　　据了解，MuseSteamer 模型家族包含 Turbo、Lite、Pro 及全系列有声版，覆盖从普通创