首发根据音频生成 4K 分辨率 1 小时长，复旦、百

2024-10-21 10:23:06

　　复旦大学和百度联合开发了一款名为 Hallo2 模型建立在 latent diffusion models 的基础上，相比上一代Hallo 模型的效果更好，Hallo2 还结合了此外，Hallo2将可调整的语义文本标签的肖像表情作为条件输入。这超出了传统的音频提示，可以提高可控性并增加所生成内容的多样性。项目页面介绍称，附Hallo2 项目地址如下：