LongCat-Video-Avatar 开源解读:音频驱动的长视频虚拟人生成如何做到更稳更真 一、摘要 LongCat-Video-Avatar 是基于 LongCat-Video 架构打造的音频驱动 Avatar(虚拟人)视频生成模型,面向“长时序、强一致性、写实动态”场景。它将音频与文本(可选参考图)作为条件,原生支持 Audio-Text-to-Video(AT2V)、Audio-Te... Ai开源 • Admin • 2025/12/17 199