百度发布自研模型MuseSteamer:一张图可生成电影级
百度商业研发团队发布自研生成模型“MuseSteamer”及创作平台“绘想”,MuseSteamer 是全球首个实现中文音一体化生成的模型。该技术可实现画面与音效、人声台词的协同创作,打破传统 AIGC “先画面后配音”的割裂流程。
据悉,MuseSteamer 在权威榜单 VBench I2V 中以 89.38% 总分登顶全球第一,支持一张图生成 10 秒 1080p 电影级画质,人物微表情与运镜效果达专业影视水准。其核心能力源于亿级中文多模态数据清洗、精细化结构化描述语言,以及多目标强化学习等技术优化。
据了解,MuseSteamer 模型家族包含 Turbo、Lite、Pro 及全系列有声版,覆盖从普通创
