首发根据音频生成 4K 分辨率 1 小时长,复旦、百
复旦大学和百度联合开发了一款名为 Hallo2 模型建立在 latent diffusion models 的基础上,相比上一代Hallo 模型的效果更好,Hallo2 还结合了此外,Hallo2将可调整的语义文本标签的肖像表情作为条件输入。这超出了传统的音频提示,可以提高可控性并增加所生成内容的多样性。项目页面介绍称,附Hallo2 项目地址如下:
复旦大学和百度联合开发了一款名为 Hallo2 模型建立在 latent diffusion models 的基础上,相比上一代Hallo 模型的效果更好,Hallo2 还结合了此外,Hallo2将可调整的语义文本标签的肖像表情作为条件输入。这超出了传统的音频提示,可以提高可控性并增加所生成内容的多样性。项目页面介绍称,附Hallo2 项目地址如下: