I. Informations de base
Mofa est une plateforme vidéo basée sur l'IA et utilisant des humains numériques 3D pour la création de vidéos et la diffusion de connaissances. Ses principaux atouts sont les humains numériques 3D, la génération vidéo par IA, la conversion de texte en vidéo, l'audio multilingue et les mouvements de caméra automatiques. La plateforme met en avant le fait qu'aucune personne réelle n'a besoin d'apparaître à l'écran ni d'effectuer de montage : il suffit de saisir du texte ou d'importer des diapositives PowerPoint pour générer automatiquement des vidéos complètes incluant personnages, scènes, éclairage et mouvements multicaméras. Elle couvre des cas d'utilisation fréquents tels que la formation en entreprise, le marketing, la diffusion de contenus médiatiques et l'éducation. Selon la plateforme, elle a déjà servi des milliers d'entreprises et propose une vaste bibliothèque d'humains numériques et de décors modifiables, permettant ainsi un processus de production de contenu standardisé et accessible à tous.
II. Présentation du produit
Basée sur la production vidéo automatisée pilotée par script, la plateforme offre un processus complet, de la saisie des données et la sélection des éléments au montage et à la diffusion finale. Les utilisateurs peuvent créer à partir de zéro, en utilisant des modèles, des scripts d'IA ou des diapositives PowerPoint. Le système génère automatiquement des voix, des expressions et des mouvements de personnages numériques, en les adaptant aux scènes 3D et au langage de la caméra. L'étape de montage permet de remplacer les personnages numériques, d'ajuster les mouvements et les expressions, de changer de scène, de modifier les plans et d'ajouter des effets de post-production, pour une itération et des mises à jour rapides. La plateforme propose la diffusion vocale multilingue et la traduction en un clic, facilitant la création de versions multilingues au sein d'un même projet et réduisant les coûts de localisation. Côté ressources, elle fournit des milliers de personnages numériques 3D hyperréalistes ainsi qu'un grand nombre de scènes et de sons 3D pour répondre aux besoins stylistiques de différents secteurs.
III. Fonctions principales
1. Fonctions principales
Conversion de texte en vidéo humaine numérique 3D, générant automatiquement le son, les expressions faciales, les mouvements et les plans.
Voix et traduction multilingues, prenant en charge la lecture naturelle de plus d'une centaine de langues et dialectes.
Une bibliothèque de ressources massive propose plus de trois mille humains numériques 3D modifiables et près d'un millier de scènes.
Les fichiers PPT et les scripts peuvent être directement liés ; il suffit de télécharger ou de modifier le texte pour recréer rapidement la version vidéo.
Édition des objectifs et des emballages, prise en charge de la prise de vue multicaméra, du changement d'objectif et des styles de post-traitement.
La retouche d'images personnalisée permet aux utilisateurs de personnaliser les traits du visage, le maquillage, les vêtements et les éléments de la marque.
2. Caractéristiques techniques
S'appuyant sur un modèle d'action textuel, il génère des expressions faciales et des actions cohérentes en fonction de la sémantique du texte.
Les capacités de mouvement de caméra 3D de Wensheng génèrent automatiquement un langage de prise de vue multicaméra de niveau réalisateur.
La technologie de synthèse vocale couvre plusieurs timbres et langues, et prend en charge la parole naturelle et la synchronisation labiale.
L'ensemble de la chaîne AIGC (IA, Générique et Exécution) est intégré, de la modélisation et de la liaison au rendu vidéo.
Les files d'attente basées sur le cloud et la génération accélérée prennent en charge le traitement des tâches avec différentes priorités et durées.
IV. Tarification et versions
Il propose deux formules d'abonnement principales : Individuelle et Entreprise. La formule Individuelle comprend une version d'essai, une version Basique et une version Standard. La version d'essai est gratuite et non destinée à un usage commercial. Elle offre un quota mensuel fixe de YanCoins et une limite d'exportation de 540p. Les versions Basique et Standard offrent des licences commerciales personnelles, avec des quotas de YanCoins plus élevés, l'exportation en 1080p, un nombre illimité de tentatives d'exportation et une accélération standard de la file d'attente. La version Entreprise propose des licences commerciales et un plus large éventail de ressources numériques (personnages, décors et sons) pour les entreprises, avec des quotas plus élevés et des options de personnalisation. Le quota de YanCoins, le temps de génération par segment, la netteté et l'étendue de la licence varient selon la version, le cycle de facturation et la région. Veuillez consulter la page d'abonnement officielle pour obtenir les informations les plus récentes.
V. Scénarios applicables et public cible
L'équipe de formation et de gestion des connaissances de l'entreprise produit des vidéos standardisées pour les cours d'intégration, de produits et de conformité.
L'équipe marketing et image de marque utilise des versions multilingues des aperçus d'événements, des présentations de produits et des supports publicitaires.
Pour les communications avec les médias et les gouvernements, générez rapidement des émissions de type studio et des reportages vidéo approfondis.
Les établissements d'enseignement et de formation peuvent générer directement des vidéos pédagogiques à partir de présentations PowerPoint, réduisant ainsi les coûts d'enregistrement pour les enseignants.
Les opérations de médias en libre-service et de commerce électronique exploitent un large éventail de rôles et de scénarios pour accroître la fréquence des mises à jour de contenu dans des catégories verticales spécifiques.
VI. Foire aux questions
Q : Le ministère des Affaires étrangères précise-t-il qu'il est nécessaire que de vraies personnes apparaissent à l'écran ou qu'un environnement de studio soit mis en place ?
A : Pas besoin. La plateforme propose des humains numériques 3D hyperréalistes avec mouvements de caméra et éclairage automatiques ; il suffit d’entrer du texte pour générer une vidéo complète avec narration.
Q : Comment sont réalisés le support multilingue et le doublage ?
A : Le système intègre une synthèse vocale multilingue et une traduction en un clic, ce qui permet de générer rapidement différentes versions linguistiques d'un même projet, le rendant ainsi adapté à la diffusion et à la localisation transfrontalières.
Q : Quelles sont les différences entre un usage commercial personnel et un usage commercial en entreprise ?
A : Les licences commerciales personnelles sont limitées aux cas d'utilisation où l'utilisateur est l'entité principale. La formation interne, la publication et la promotion de comptes d'entreprise, etc., relèvent des licences commerciales d'entreprise et nécessitent la sélection de la licence correspondante.
Q : Permet-il de générer des vidéos directement à partir de présentations PowerPoint et de les modifier ensuite à plusieurs reprises ?
R : Oui. Il suffit de télécharger ou de modifier le fichier PPT et le script pour régénérer la présentation finale, ce qui facilite une itération rapide dans des scénarios de formation et de publication fréquemment mis à jour.
Q : La capacité de clonage humain numérique est-elle disponible ?
A : La page officielle indique que le clone humain numérique est en cours de développement et que sa disponibilité et sa date d'ouverture dépendent du lancement effectif.