Das LongCat-Team von Meituan brachte LongCat-Video-Avatar auf den Markt: für langjährige Videogenerierung von Sprechern und Mehrcharakter-Szenen

KI-Informationen • Admin • 16.12.2025 • 140 Aufrufe

Meituans LongCat-Team kündigte die Veröffentlichung von LongCat-Video-Avatar im LongCat-Video-Codebasis-Update an und startete gleichzeitig die Projektseite sowie die Hugging Face-Gewichte. Basierend auf der LongCat-Video-Architektur unterstützt das Modell Audio-Text-to-Video (AT2V), Audio-Text-Bild-zu-Video (ATI2V) und Videofortsetzung mit Audiobedingungen, was die Erstellung von Einpersonen-, Mehrzeichen- und Langzeit-Inhalten abdeckt.

Laut öffentlichen Materialien konzentriert sich LongCat-Video-Avatar auf Stabilität langer Sequenzen und natürlichere dynamische Performance: Cross-Chunk Latent Stitching reduziert Verfall und Nahtprobleme bei der Erzeugung langer Videos und verwendet Reference Skip Attention, um "Hardcopy"-Traces zu reduzieren und gleichzeitig die Identitätskonsistenz zu erhalten; Gleichzeitig wird eine Entkopplungssteuerungsstrategie vorgeschlagen, um die Überabhängigkeit von Sprachsignalen zu verringern und das Problem zu steifer stiller Segmente zu verbessern. Das Team nannte EvalTalker als Maßstab für menschliche Bewertung in der Modellkarte und zeigte den Vergleich von Natürlichkeit und Realismus, aber Details wie externe Listenrankings und Teilnehmergröße wurden auf der öffentlichen Seite nicht vollständig offengelegt, und die relevanten Schlussfolgerungen müssen weiterhin auf dem Evaluationspapier und reproduzierbaren Experimenten basieren.

FAQs

F: Welches Modell ist der LongCat-Video-Avatar?

A: LongCat-Video-Avatar ist ein audiobasiertes Video-Generierungsmodell für Charakterperformance, das Long-Timing-Stabilität, Lippensynchronisation und Identitätskonsistenz betont.

F: Welche Generationsmodi unterstützt das LongCat-Video-Avatar, das vom LongCat-Team von Meituan veröffentlicht wurde?

A: LongCat-Video-Avatar unterstützt AT2V, ATI2V sowie Videofortsetzung und lange Videoerweiterung für Audiobedingungen.

F: Was ist der Unterschied zwischen LongCat-Video-Avatar und InfiniteTalk?

A: LongCat-Video-Avatar legt in der Einleitung mehr Wert auf natürliche Dynamik und stabilere Langsequenz-Performance und verwendet Reference Skip Attention, um das durch Referenzbildinjektion verursachte "Copy-Paste"-Artefakt zu reduzieren.

F: Auf welche Risiken sollten Entwickler achten, wenn sie LongCat-Video-Avatar verwenden?

A: Entwickler müssen auf Porträt- und Audiolizenzen, Compliance und Inhaltssicherheit achten und vermeiden, missbrauchte Charakterinhalte ohne Erlaubnis zu erstellen.

Das LongCat-Team von Meituan brachte LongCat-Video-Avatar auf den Markt: für langjährige Videogenerierung von Sprechern und Mehrcharakter-Szenen

Verwandte Artikel

Kiro hat zwei neue Powers hinzugefügt: die Ein-Klick-Generierung der AWS CDK- und CloudFormation-Infrastruktur sowie die Integration mit Amazon Aurora

LongCat-Video-Avatar Open-Source-Interpretation: Wie man die audiogetriebene Langvideo-Avatargenerierung stabiler und realistischer macht

Kimi K3 wurde offiziell gestartet: 2,8 Billionen Parameter mit Einsatz auf Millionen von Kontexten und offenem Gewicht

Mistral Studio fügt Prompt-Versionsmanagement hinzu: Enterprise AI verwaltet jetzt Verhaltensressourcen

Empfohlene Tools

Das LongCat-Team von Meituan brachte LongCat-Video-Avatar auf den Markt: für langjährige Videogenerierung von Sprechern und Mehrcharakter-Szenen

Verwandte Artikel

Kiro hat zwei neue Powers hinzugefügt: die Ein-Klick-Generierung der AWS CDK- und CloudFormation-Infrastruktur sowie die Integration mit Amazon Aurora

LongCat-Video-Avatar Open-Source-Interpretation: Wie man die audiogetriebene Langvideo-Avatargenerierung stabiler und realistischer macht

Kimi K3 wurde offiziell gestartet: 2,8 Billionen Parameter mit Einsatz auf Millionen von Kontexten und offenem Gewicht

Mistral Studio fügt Prompt-Versionsmanagement hinzu: Enterprise AI verwaltet jetzt Verhaltensressourcen

Empfohlene Tools

KI-Tool einreichen

Bitte bestätigen Sie die Einreichungsinformationen