Alibaba brachte eine neue Generation von Tongyi Wanxiang 2.6 (Wan 2.6) Modellen heraus, die für professionelle Film- und Fernsehproduktionen sowie Bilderzeugung aufgerüstet sind, und hat gleichzeitig Alibaba Cloud Bailian und Wanxiang-bezogene Eingänge eingeführt. Die neue Version konzentriert sich auf "Rollenspiel" und Multi-Kamera-Erzählung: Man kann sich auf das Aussehen und den Klangfarben der Figuren im Eingabevideo beziehen, Einzel-, Mehrpersonen- oder Co-Shot-Videos mit Personen und Objekten entsprechend den Prompts erstellen und die einfachen Prompts zu Multi-Shot-Skripten erweitern, um das Querkamera-Motiv und die Szene so konsistent wie möglich zu halten.
Bezüglich der Fähigkeiten legt Wanxiang 2.6 großen Wert auf natürliche Ton- und Bildsynchronisation sowie stabilere Mehrpersonendialoge, wobei Musik- und Songgenerierung berücksichtigt wird; die Videoerzeugung kann bis zu 15 Sekunden dauern (einige Referenzgenerierungsformen sind mit 10 Sekunden gekennzeichnet) und unterstützt "Audio Drive" zur Steuerung von Multikamera-Interpretation mit Text und Audio. Die Alibaba Cloud-Seite bietet außerdem Abrechnungstipps auf der API-Seite, und der Preis des entsprechenden Videomodell-Anrufs ist ab 0,6 Yuan/Sekunde angegeben; die tatsächlichen Kosten, Quoten und verfügbare Kapazitäten hängen von der Plattformkonsole und der Produktbeschreibung ab.
Mit der Verbesserung steuerbarer Storyboards, des Charakterauftritts und der Stimmmigration wurde die kreative Schwelle tatsächlich weiter gesenkt, aber mehr Aufmerksamkeit muss auf Porträtrechte, Tonrechte und Urheberrechtseinhaltung gelegt werden. Bei der Verwendung echter Charakterbilder, Sprachausgaben oder Branding-Elemente wird empfohlen, autorisierte und nachverfolgbare Quellen sicherzustellen, um das Risiko von Verletzungen oder irreführender Kommunikation zu vermeiden.
FAQ
F: Was ist Wan 2.6?
A: Es handelt sich um eine neue Generation von Bild- und Videomodellserien im Rahmen des Alibaba Tongyi-Systems, die ihre Fähigkeiten für Film- und Fernsehproduktion verbessert hat.
F: Was ist die "Rollenspielfunktion" in Wanxiang 2.6?
A: Das Modell kann sich auf das Aussehen und den Klangfarben der Charaktere im Eingabevideo beziehen und dann je nach Eingabeaufforderung Videoinhalte für einzelne Personen, mehrere Personen oder Personen und Objekte generieren.
F: Wie verwendet man die "Multi-Lens-Erzählung" und das "Smart Storyboard" von Wanxiang 2.6?
A: Nach Eingeben eines einfachen Prompts kann das Modell ein Multi-Storyboard-Skript erstellen und ein kohärentes Video mit mehreren Einstellungen produzieren, wobei möglichst Konsistenz zwischen den Aufnahmen gewahrt bleibt.
F: Wie lange kann Wanxiang 2.6 maximal Videos erzeugen, und unterstützt es Audio- und Videosynchronisation?
A: Die öffentlichen Videoinformationen zeigen, dass sie bis zu 15 Sekunden Video erzeugen können, und betonen die stabile Erzeugung von Mehrpersonendialogen sowie einen natürlicheren Ton- und Bildsynchronisationseffekt.
F: Was sind die Nutzungskosten und Risikopunkte von Wanxiang 2.6?
A: Die Plattformseite verzeichnet einige API-Aufrufpreise ab 0,6 Yuan/Sekunde; Wenn Sie das Unternehmen nutzen, achten Sie auf Quoten und Abrechnungsregeln sowie auf Porträtrechte, Tonrechte und Urheberrechtsautorisierung.