LongCat-Video-Avatar长时序一致生成

找到 1 篇相关文章

LongCat-Video-Avatar 开源解读：音频驱动的长视频虚拟人生成如何做到更稳更真

一、摘要 LongCat-Video-Avatar 是基于 LongCat-Video 架构打造的音频驱动 Avatar（虚拟人）视频生成模型，面向“长时序、强一致性、写实动态”场景。它将音频与文本（可选参考图）作为条件，原生支持 Audio-Text-to-Video（AT2V）、Audio-Te...

Ai开源 • Admin • 2025/12/17

232

LongCat-Video-Avatar长时序一致生成

LongCat-Video-Avatar 开源解读：音频驱动的长视频虚拟人生成如何做到更稳更真

推荐工具

提交AI工具

请确认提交信息