MiniMax a lancé simultanément « MiniMax Music 2.0 » sur les réseaux sociaux et son site web officiel, le présentant comme un « compositeur, chanteur et producteur IA ». L'application met l'accent sur des voix réalistes, la compatibilité multi-genres et l'expression des émotions, avec des fonctionnalités telles que les duos et les performances a cappella. Les supports marketing affirment qu'elle peut générer jusqu'à 5 minutes d'audio, avec des arrangements multi-instrumentaux contrôlables et une qualité sonore professionnelle. Parallèlement, la documentation API officielle mentionne le nom du modèle « music-2.0 », proposant une interface appelée « /v1/music_generation », qui requiert la saisie de descriptions de style/d'émotion et de paroles, et permet de sélectionner des formats tels que MP3 et une fréquence d'échantillonnage de 44,1 kHz. La sortie peut être une URL temporaire ou des données audio HEX.
Il est important de noter que les paramètres spécifiques tels que les limites de durée, le contrôle précis des duos et les performances multi-instrumentales ne sont pas détaillés dans la documentation ; veuillez consulter la page produit et ses mises à jour pour obtenir les informations les plus précises. Concernant les aspects vérifiables, il est actuellement confirmé que le logiciel permet de générer des chansons complètes avec voix et accompagnement directement à partir du texte et des paroles, que les paramètres audio de base sont configurables et qu'une procédure d'authentification standard est disponible pour les développeurs.
Foire aux questions
Q : Quelles sont les principales fonctionnalités de MiniMax Music 2.0 ?
A: Il est conçu pour la création intégrée de la composition, du chant et de la production, couvrant des styles tels que la pop, le jazz, le blues, le rock, le folk, etc., mettant l'accent sur le chant réaliste et le contrôle émotionnel, et prenant en charge le chant a cappella ou à plusieurs voix.
Q : Permet-il réellement de contrôler plusieurs instruments pendant 5 minutes avec précision ?
A : Les arguments marketing contiennent des informations pertinentes, mais la documentation de l'API ne précise pas la limite supérieure exacte ni le niveau de contrôle. Il est recommandé de consulter la page produit officielle et les instructions qui y sont associées.
Q : Comment les développeurs peuvent-ils intégrer cette fonctionnalité ?
A : Appelez « /v1/music_generation » avec les paramètres suivants : model=music-2.0, prompt (style/scene/mood), lyrics (pouvant inclure les balises de structure [Verse]/[Chorus]) et audio_setting (fréquence d'échantillonnage/débit binaire/format). La sortie peut être au format URL ou HEX.
Q : Dans quelle mesure les paramètres de qualité sonore sont-ils configurables ?
A : L'exemple de document montre un échantillonnage à 44 100 Hz, un débit binaire de 256 kbps et un format MP3 ; les résultats liés ont une période de validité limitée et doivent être téléchargés et enregistrés à temps.
Q : Comment sont gérées la conformité et l'autorisation ?
A : Veuillez vous référer aux conditions générales officielles de MiniMax ; le droit d'auteur, l'utilisation commerciale et l'utilisation des documents pour le contenu généré doivent être conformes aux politiques de la plateforme et aux lois applicables.