Alibaba a lancé une nouvelle génération de modèles Tongyi Wanxiang 2.6 (Wan 2.6), qui sont mis à jour pour la production professionnelle de films et de télévision ainsi que pour la création d’images, et ont simultanément lancé Alibaba Cloud Bailian et des entrées liées à Wanxiang. La nouvelle version met l’accent sur le « jeu de rôle » et la narration multi-caméras : vous pouvez vous référer à l’apparence et au timbre des personnages dans la vidéo d’entrée, générer des vidéos individuelles, multi-personnes ou co-tournées avec des personnes et des objets selon les consignes, et étendre les prompts simples à des scénarios multiples pour maintenir autant que possible la cohérence du sujet et de la scène en caméra croisée.
En termes de détails de capacité, Wanxiang 2.6 met l’accent sur la synchronisation naturelle du son et de l’image ainsi que sur un dialogue multi-personne plus stable, en tenant compte de la musique et de la génération des chansons ; la génération vidéo peut durer jusqu’à 15 secondes (certaines formes de génération de référence sont indiquées comme 10 secondes), et prend en charge le « lecteur audio » pour piloter l’interprétation multi-caméras avec texte et audio. La page Alibaba Cloud fournit également des conseils de facturation côté API, et le prix de l’appel vidéo correspondant est annoncé à partir de 0,6 yuan/seconde, et le coût réel, le quota et la capacité disponible dépendent de la console de la plateforme et de la description du produit.
Avec l’amélioration des storyboards contrôlables, de l’apparence des personnages et des capacités de migration vocale, le seuil créatif a effectivement été encore abaissé, mais il faut accorder plus d’attention aux droits de portrait, aux droits sonores et au respect des droits d’auteur. Lorsqu’on utilise de vraies images de personnages, du doublage ou des éléments de branding, il est recommandé de s’assurer de sources autorisées et traçables afin d’éviter le risque d’infraction ou de communication trompeuse.
FAQ
Q : Qu’est-ce que Wan 2.6 ?
R : Il s’agit d’une nouvelle génération de séries de modèles de génération d’images et de vidéos sous le système Alibaba Tongyi, qui a amélioré ses capacités pour la création de films et de télévision.
Q : Quelle est la « fonction de jeu de rôle » dans Wanxiang 2.6 ?
R : Le modèle peut se référer à l’apparence et au timbre des personnages dans la vidéo d’entrée, puis générer du contenu vidéo pour une seule personne, plusieurs personnes, ou des personnes et des objets selon les consignes.
Q : Comment utiliser le « récit multi-lentille » et le « storyboard intelligent » de Wanxiang 2.6 ?
R : Après avoir saisi une simple consigne, le modèle peut générer un script multi-storyboard et produire une vidéo cohérente avec plusieurs plans tout en maintenant autant que possible la cohérence entre les plans.
Q : Combien de temps Wanxiang 2.6 peut-il générer un maximum de vidéos, et supporte-t-il la synchronisation audio et vidéo ?
R : Les informations vidéo publiques montrent qu’elles peuvent générer jusqu’à 15 secondes de vidéo, et mettent l’accent sur la génération stable de dialogues multi-personnes ainsi qu’un effet de synchronisation sonore et d’image plus naturel.
Q : Quels sont les coûts d’utilisation et les points de risque de Wanxiang 2.6 ?
R : La page de la plateforme indique certains prix d’appels API à partir de 0,6 yuan/seconde ; Lorsque vous utilisez l’entreprise, faites attention aux quotas et aux règles de facturation, ainsi qu’aux droits de portrait, aux droits sonores et à l’autorisation du droit d’auteur.