阿里团队推出 Tora AI 生成框架:画圈操控物体运
阿里团队最新推出了 AI 生成框架 Tora,Tora 由一个轨迹提取器、一个时空 DiT 和一个运动引导融合器组成:
TE 使用 3D 压缩网络将任意轨迹编码为分层时空运动补丁。
MGF 将运动贴片集成到 DiT 模块中,以生成遵循轨迹的连贯。
Tora 无缝契合 DiT 设计,支持制作最长 204 帧、720P 分辨率的,可以精确控制不同持续时间、宽高比和分辨率的内容。大量实验证明,Tora 在实现高运动保真度方面表现出色,同时还能细致模拟物理世界的运动。
其独特设计理念融合文本、附上参考地址
