Retour à Informations sur l’IA
SAM Audio lance Segment Anything Playground : Extraire tout élément sonore d’une piste mixée

SAM Audio lance Segment Anything Playground : Extraire tout élément sonore d’une piste mixée

Informations sur l’IA Admin 160 vues

Meta a lancé SAM Audio (SAM-Audio), positionné comme un modèle d’IA « unifié » de segmentation et d’édition audio, dans le but d’isoler et de modifier rapidement des sons spécifiques dans des mixages complexes. Les cas d’usage typiques incluent l’extraction individuelle de guitares ou de voix d’une vidéo de groupe, le filtrage du bruit de la circulation extérieure, ainsi que la suppression de distractions comme les aboiements de chiens des podcasts.

L’approche interactive de SAM Audio met l’accent sur les « prompts intuitifs humains » et prend en charge trois types d’invites qui peuvent être superposés : les prompts textuels (comme taper « dog qui aboie » et « voix chantée »), les prompts visuels (cliquer sur la personne ou l’objet qui produit un son à l’écran vidéo pour verrouiller la source sonore), et les prompts de période (marquer le son cible qui apparaît dans une certaine plage de temps). Meta propose également un portail de démonstration en ligne, Segment Anything Playground, qui permet aux utilisateurs d’expérimenter les capacités des modèles en utilisant des supports de plateforme ou en téléchargeant leur propre audio et vidéo, et ouvre les téléchargements de modèles et l’inférence locale.

Du côté open source et écologique, le dépôt officiel fournit du code d’inférence et des cahiers d’exemple, et publie des poids de modèles de plusieurs tailles (petit/base/grand), ainsi que des variantes offrant de meilleures performances de consignes visuelles. Il convient de noter qu’à ce stade, la forme de la consigne est principalement composée de texte, d’image et de période, et que la séparation fine peut encore être limitée dans le scénario de la « source sonore similaire ». En ce qui concerne la production commerciale, l’audio protégé par le droit d’auteur et les sons des personnages, vous devriez également évaluer les risques de licence, de conformité et de stabilité sonore finale.

FAQ

Q : Quel type de modèle est SAM Audio ?

R : SAM Audio est un modèle d’IA unifié pour la séparation et le montage audio, isolant le son cible de l’audio mixé complexe et produisant des résultats éditables.

Q : Quels indices SAM Audio supporte-t-il pour localiser les sons ?

R : SAM Audio prend en charge les prompts textuels, visuels (cliquez sur l’objet sonore dans l’écran vidéo) et les prompts temporels, et peut combiner plusieurs invites.

Q : À quels scénarios créatifs et de post-production SAM Audio convient-il ?

R : Les scénarios courants dans SAM Audio incluent la séparation instrument/piste vocale, la réduction du bruit en enregistrement extérieur, la suppression du bruit de podcast et l’amélioration de la source sonore en post-production vidéo.

Q : Que peut faire Segment Anything Playground ?

R : Segment Anything Playground propose un portail d’expérience en ligne où vous pouvez tester les capacités de séparation et d’édition de SAM Audio avec des échantillons de matériel ou des audios et vidéos téléchargés, et les fonctions spécifiques ainsi que le champ d’utilisation sont soumis aux règles de la page.

Q : Comment obtenir et utiliser les poids open source de SAM Audio ?

R : SAM Audio fournit du code d’inférence open source et des poids multidimensionnels, dont certains peuvent être téléchargés après que la plateforme hôte modèle nécessite des permissions d’accès.

Édition audio unifiée de SAM Audio SAM Audio isole les mixages complexes comme demandé Les invites de texte audio SAM verrouillent la source sonore cible SAM Audio visuel cliquez pour localiser la source sonore L’annotation des périodes de temps audio SAM est précisément séparée Les trois types de conseils de SAM Audio peuvent être empilés SAM Audio extrait guitare et voix dans les morceaux Podcast audio SAM Solution pour le bruit de chien qui aboie SAM Audio filtre les bruits de bruit extérieurs L’audio SAM renforce des sons spécifiques en post-production vidéo Portail de la cour de jeux de présentation en ligne de SAM Audio SAM Audio prend en charge l’envoi d’expériences audio et vidéo Code d’inférence open source et exemples de SAM Audio Les poids multidimensionnels de SAM Audio sont de petite à grande taille Les indices audio SAM améliorent l’analyse variante Commencez rapidement avec le déploiement d’inférence sur site de SAM Audio La séparation de la source similaire en SAM Audio reste limitée La production commerciale de SAM Audio nécessite une évaluation de la qualité sonore Points de conformité à l’utilisation audio protégée par le droit d’auteur de SAM Audio Avertissement de risque d’autorisation vocale audio SAM SAM Audio sépare les instruments individuels du mixage SAM Audio utilise l’écran pour cliquer et verrouiller le corps sonore L’audio SAM capture le bruit cible avec une fenêtre temporelle Méthode d’invite articulée audio textuelle et visuelle SAM SAM Audio convient à l’extraction vocale dans des vidéos de performance SAM Audio convient à la réduction du bruit vidéo courte et à la clarté Processus de suppression du bruit après le podcast SAM Audio La segmentation audio SAM Audio et le montage sont intégrés SAM Audio unifie l’interaction pour abaisser le seuil de post-production SAM Audio prend en charge le filtrage du son ambiant et de l’écho Poids des modèles SAM Audio pour télécharger et instructions de licence Guide d’application de la plateforme d’hébergement de modèles audio SAM Interprétation officielle du carnet de notes d’inférence audio SAM Les petits modèles SAM Audio sont adaptés aux mobiles Le grand modèle SAM Audio améliore l’effet d’invite visuelle Les techniques pratiques de SAM Audio pour séparer les solos de guitare SAM Audio extrait des dialogues et des arrière-plans de vidéos Invite audio SAM pour supprimer le bruit de circulation SAM Audio utilise la commande d’aboiement du chien pour éliminer le bruit SAM Audio utilise la voix chantée pour extraire les voix Comment séparer une scène de mixage multi-sources dans SAM Audio Le montage audio SAM Audio prend en charge le montage et l’amélioration Relation entre l’écosystème SAM Audio et Segment Anything Le guide complet de l’expérience en ligne de terrain de jeu de SAM Audio Exemple rapide de passage en code open source de SAM Audio Exigences et optimisations de la mémoire d’inférence locale audio SAM Liste de l’Index d’évaluation de la stabilité sonore de SAM Audio Les risques de conformité post-production de SAM Audio sont pleinement compris SAM Audio convient au doublage de films et de séries télévisées ainsi qu’aux scénarios de réduction du bruit Le modèle unifié de SAM Audio ouvre une nouvelle voie de segmentation audio

Outils Recommandés

Plus