快手可灵上线图生与最长 3 分钟的续写功能
快手可灵新功能“图生”和“续写”今日上线。
附快手可灵官方网站:
可灵是由快手自研打造的生成大模型,能够生成大幅度的合理运动,模拟物理世界特性。
可灵使用了 DiT 架构,快手对模型中的隐空间编 / 解码、时序建模等模块进行了升维处理。
在隐空间编 / 解码上,快手自研了 3D VAE 网络,实现时空同步压缩,获得了较高的重建质量,在训练性能和效果之间取得了平衡。在时序信息建模上,快手设计了一款全注意力机制作为时空建模模块。
快手可灵新功能“图生”和“续写”今日上线。
附快手可灵官方网站:
可灵是由快手自研打造的生成大模型,能够生成大幅度的合理运动,模拟物理世界特性。
可灵使用了 DiT 架构,快手对模型中的隐空间编 / 解码、时序建模等模块进行了升维处理。
在隐空间编 / 解码上,快手自研了 3D VAE 网络,实现时空同步压缩,获得了较高的重建质量,在训练性能和效果之间取得了平衡。在时序信息建模上,快手设计了一款全注意力机制作为时空建模模块。