Retour à Informations sur l’IA
Aperçu de Wan 2.5 Synchronisation audio et vidéo améliorée : jusqu'à 10 secondes de vidéo et une qualité d'image améliorée sont désormais disponibles

Aperçu de Wan 2.5 Synchronisation audio et vidéo améliorée : jusqu'à 10 secondes de vidéo et une qualité d'image améliorée sont désormais disponibles

Informations sur l’IA Admin 30 vues

Wan 2.5 a ajouté la génération vidéo native pilotée par l'audio à la version préliminaire. Les utilisateurs peuvent directement fournir l'audio comme signal de contrôle, combiné à des invites textuelles ou des images de référence, pour les conversions texte-vidéo et image-vidéo. La description officielle met l'accent sur les capacités de synchronisation audio et vidéo, et la phase de prévisualisation inclut des spécifications de sortie 1080p, 24 ips, avec une durée vidéo maximale de 5 ou 10 secondes, selon le modèle sélectionné et les paramètres d'interface. Cette mise à jour vise à permettre à la narration, à la musique ou au son d'ambiance de déterminer le rythme et la direction narrative des prises de vue, pour une génération de courts métrages plus cohérente.

Alibaba Cloud Bailian et son site web indiquent également que la prévisualisation « Vidéo avec son » de Wan 2.5 prend en charge le doublage automatique ou l'entrée de fichiers audio personnalisés, ce qui la rend idéale pour des scénarios tels que la publicité, les démonstrations e-commerce et les courts métrages créatifs. Puisqu'il s'agit d'une prévisualisation, les fonctionnalités et la disponibilité pourront être progressivement étendues à différentes plateformes et régions. Les performances spécifiques doivent encore être vérifiées en fonction des séquences et des processus en aval. Des évaluations indépendantes indiquent également que les performances fluctuent encore en termes de stabilité des portraits et des mouvements ; il est donc recommandé de réaliser des tests sur de petits échantillons de séquences pour chaque projet.

Questions fréquemment posées

Q : Comment l’audio est-il impliqué dans la génération ?

R : Vous pouvez télécharger de l'audio comme signal de conduite et le combiner avec des invites textuelles ou des images de référence pour guider le rythme de la prise de vue, l'émotion et la synchronisation labiale.

Q : Quelle longueur et quelles spécifications sont prises en charge ?

R : L'interface d'aperçu fournit deux paramètres : 5 secondes et 10 secondes, fixés à 24 ips, jusqu'à 1080p, et peuvent être exportés vers MP4 (H.264).

Q : Quelles entrées sont disponibles ?

R : La page produit Tongyi Wanxiang/Wan et l'API Alibaba Cloud Bailian ont répertorié des modèles d'aperçu avec des capacités audio et des descriptions de paramètres.

Q : Comment est la stabilité ?

R : La démo officielle montre que la synchronisation audio et vidéo est disponible, mais les évaluations tierces indiquent que la cohérence des portraits et des mouvements fluctue encore et doit être testée en fonction de différents scénarios.

Q : Disponibilité commerciale et régionale ?

R : Il s'agit d'une fonctionnalité préliminaire. La portée et les conditions d'activation dépendent des pages de la plateforme et des autorisations de compte de chaque plateforme, et peuvent être progressivement étendues selon la région.

Pilote audio natif Wan2.5 Aperçu audio vidéo Wan2.5 Synchronisation audio et vidéo Wan2.5 Wan2.5 Texte en vidéo Conversion d'image en vidéo Wan2.5 Contrôle d'image de référence Wan2.5 Pilote de narration Wan2.5 Pilote de musique Wan2.5 Pilote de son ambiant Wan2.5 Synchronisation labiale Wan2.5 Contrôle du rythme de l'objectif Wan2.5 Wan2.5 Cohérence narrative Sortie Wan2.5 1080p Fréquence d'images fixe Wan2,524 ips Spécifications WAN 2,55 secondes Spécifications Wan2.510 secondes Exportation Wan2.5MP4_H264 Doublage automatique Wan2.5 Audio personnalisé Wan2.5 API Wan2.5 Alibaba Cloud Bailian Wan2.5 Entrée Tongyi Wanxiang Génération de vidéos publicitaires Wan2.5 Vidéo de démonstration du commerce électronique Wan2.5 Wan2.5 Court métrage créatif Fonctionnalités d'aperçu de Wan 2.5 Wan2.5 augmente progressivement le volume Évaluation de la stabilité de Wan2.5 Cohérence des portraits Wan2.5 Stabilité du mouvement Wan2.5 Petit échantillon de test Wan2.5 Paramètres et interfaces Wan2.5 Sélection du modèle Wan2.5 Limite de durée Wan2.5 Spécification de la fréquence d'images Wan2.5 Sortie haute résolution Wan2.5 Combinaison de mots d'invite Wan2.5 Guide d'image de référence Wan2.5 Signal de contrôle du son Wan2.5 Contrôle de génération vidéo Wan2.5 Alignement de diffusion orale Wan2.5 Pilote de rythme musical Wan2.5 Récit sonore ambiant Wan2.5 Aperçu de la plage ouverte de Wan2.5 Intégration Wan2.5 Enterprise Exemple d'appel d'API Wan2.5 Réglage de l'intensité du contrôle Wan2.5 Meilleures pratiques pour les scénarios Wan2.5 Utilisation commerciale et conditions de Wan2.5 Évaluation du projet Wan2.5 FAQ Wan2.5

Outils Recommandés

Plus