返回AI资讯
美团LongCat团队推出LongCat-Video-Avatar:面向长时序说话人视频生成与多人物场景

美团LongCat团队推出LongCat-Video-Avatar:面向长时序说话人视频生成与多人物场景

AI资讯 Admin 125 次浏览

美团LongCat团队在LongCat-Video代码库更新中宣布发布LongCat-Video-Avatar,并同步上线项目页与Hugging Face权重。该模型定位为“音频驱动”的人物视频生成方案,基于LongCat-Video架构,支持Audio-Text-to-Video(AT2V)、Audio-Text-Image-to-Video(ATI2V)以及音频条件的视频续写,可覆盖单人、多人物与长时长内容生成。

公开材料显示,LongCat-Video-Avatar主打长序列稳定性与更自然的动态表现:通过Cross-Chunk Latent Stitching减少长视频生成中的退化与接缝问题,并用Reference Skip Attention在保持身份一致性的同时降低“硬复制”痕迹;同时提出解耦式引导策略,减少对语音信号的过度依赖,改善静音段过于僵硬的问题。团队在模型卡中引用EvalTalker作为人类评测基准并展示自然度与真实感对比,但外部榜单排名、参与者规模等细节在公开页面未完整披露,相关结论仍需以评测论文与可复现实验为准。

常见问题

Q:LongCat-Video-Avatar是什么模型?

A:LongCat-Video-Avatar是面向人物表演的音频驱动视频生成模型,强调长时序稳定性、口型同步与身份一致性。

Q:美团LongCat团队发布的LongCat-Video-Avatar支持哪些生成模式?

A:LongCat-Video-Avatar支持AT2V、ATI2V,以及音频条件的视频续写与长视频扩展。

Q:LongCat-Video-Avatar与InfiniteTalk的差异点是什么?

A:LongCat-Video-Avatar在介绍中强调更自然的动态与更稳的长序列表现,并用Reference Skip Attention降低参考图注入导致的“复制粘贴”伪影。

Q:开发者使用LongCat-Video-Avatar需要注意哪些风险?

A:开发者需要关注肖像与音频授权、合规与内容安全,并避免在未获许可情况下生成可被误用的仿真人物内容。

美团LongCat发布Avatar视频模型 美团LongCat上线音频驱动头像 LongCat-Video-Avatar权重公开 LongCat-Video-Avatar支持长视频 LongCat-Video-Avatar主打稳定性 美团LongCat强化口型与身份 LongCat-Video-Avatar支持AT2V LongCat-Video-Avatar支持ATI2V LongCat-Video-Avatar支持续写 美团LongCat覆盖多人物生成 美团LongCat支持单人长时长 LongCat-Video-Avatar降接缝退化 LongCat-Video-Avatar引入拼接 美团LongCat采用Latent拼接 LongCat-Video-Avatar更自然动态 LongCat-Video-Avatar降低伪影 美团LongCat用Skip注意力 LongCat-Video-Avatar保身份一致 美团LongCat减少硬复制痕迹 LongCat-Video-Avatar解耦引导 美团LongCat改善静音僵硬 LongCat-Video-Avatar弱化语音依赖 美团LongCat引用EvalTalker评测 LongCat-Video-Avatar展示对比 美团LongCat未披露榜单细节 LongCat-Video-Avatar需可复现 美团LongCat同步项目页上线 美团LongCat同步HF权重发布 LongCat-Video-Avatar面向表演 LongCat-Video-Avatar强调真实感 LongCat-Video-Avatar强调自然度 美团LongCat更新代码库发布 LongCat-Video-Avatar适合创作 美团LongCat推动音频视频生成 LongCat-Video-Avatar支持条件续写 LongCat-Video-Avatar支持扩展 美团LongCat覆盖音频条件生成 LongCat-Video-Avatar支持文生视频 LongCat-Video-Avatar支持图文音 美团LongCat提升长序列一致性 LongCat-Video-Avatar解决接缝 美团LongCat优化参考图注入 LongCat-Video-Avatar对标InfiniteTalk 美团LongCat强调差异与亮点 LongCat-Video-Avatar适用多场景 美团LongCat提示肖像授权风险 LongCat-Video-Avatar需合规使用 美团LongCat强调内容安全边界 LongCat-Video-Avatar避免仿真滥用

推荐工具

更多