MiniMaxは、ソーシャルメディアと公式サイトで同時に「MiniMax Music 2.0」を発表し、「AI作曲家、歌手、プロデューサー」と位置付けています。リアルなボーカル、ジャンルを超えた表現力、感情表現を重視し、デュエットやアカペラ演奏などの機能を搭載しています。マーケティング資料によると、最大5分間の音声を生成でき、複数の楽器を自在にアレンジでき、プロ仕様の音質を実現しています。公式APIドキュメントにはモデル名「music-2.0」が記載されており、「/v1/music_generation」というインターフェースが提供され、スタイルや感情の説明と歌詞を入力することで、MP3や44.1kHzのサンプリングレートなどのフォーマットを選択できます。出力は一時的なURLまたはHEX形式の音声データです。
長さの制限、デュエットのきめ細かな制御、複数楽器の演奏といった具体的な指標については、ドキュメントでは項目ごとに定量化されていない点にご注意ください。正確な情報については、製品ページおよびその後のアップデートをご参照ください。検証可能な点としては、テキストと歌詞から直接、ボーカルと伴奏を含む完全な楽曲を生成できること、基本的なオーディオパラメータを設定できること、開発者向けの標準認証プロセスが利用できることが現在確認されています。
よくある質問
Q: MiniMax Music 2.0 の主な機能は何ですか?
A: ポップ、ジャズ、ブルース、ロック、フォークなどのスタイルをカバーし、リアルな歌唱と感情のコントロールを重視し、アカペラや多声歌唱をサポートするなど、作曲、歌唱、制作の統合的な創作を目的として設計されています。
Q: 本当に 5 分間と複数の機器の細かい制御をサポートしていますか?
A: マーケティングコピーには関連する記述がありますが、APIドキュメントには正確な上限値と制御粒度は記載されていません。公式製品ページとそれに続く指示を参照することをお勧めします。
Q: 開発者はこの機能をどのように統合できますか?
A: model=music-2.0、prompt(スタイル/シーン/ムード)、lyrics([Verse]/[Chorus]構造タグを含めることができます)、audio_setting(サンプルレート/ビットレート/フォーマット)などのパラメータを指定して、"/v1/music_generation"を呼び出します。出力はURLまたはHEXでサポートされます。
Q: 音質パラメータはどの程度まで設定できますか?
A: ドキュメントの例では、44100Hz サンプリング、256kbps ビットレート、MP3 形式が示されています。リンクされた結果には有効期限があり、時間内にダウンロードして保存する必要があります。
Q: コンプライアンスと承認はどのように処理されますか?
A: MiniMax の公式利用規約を参照してください。生成されたコンテンツの著作権、商用利用、素材の使用は、プラットフォームのポリシーと関連法に準拠する必要があります。