Qwen3-TTSは最新バージョンをリリース:49+の新しい音声と多言語・多方言対応

AI情報 • Admin • 2025/12/6 • 211 回閲覧

アリババの通義チームは、音声合成モデルQwen3-TTSの新バージョン(2025年11月27日)をリリースし、音色の豊かさ、多言語性、自然さに関する包括的なアップグレードに焦点を当てました。公式には、このバージョンは活気ある可愛らしいものから安定して真剣なものまで、49以上の高品質な音色を提供し、さまざまな用途に対応しています。ユーザーはブランドやコンテンツの雰囲気により合った音色を自分のニーズに応じて選択できます。

言語・方言対応の面では、新バージョンのQwen3-TTSは中国語、英語、ドイツ語、イタリア語、ポルトガル語、スペイン語、日本語、韓国語、フランス語、ロシア語の10言語をカバーし、さらに福建語、呉語、広東語、四川語、北京語、南京語、天津語、山西語などの地域アクセントも加えています。モデルの話す速度、間、トーンの制御はさらに洗練され、テキストや文脈に応じてリズムを自動的に調整する能力が強調され、「現実感」を高めています。

Qwen3-TTSは現在、Qwen Chatの「Read and Reply」機能を通じて直接体験でき、リアルタイムAPIとオフラインAPIの両方を同時に開放し、開発者がさまざまなアプリケーションに音声機能を組み込むのを簡単にできるようにしています。また、Hugging FaceとMagic Partnershipコミュニティでオンラインデモも開始し、ユーザーがさまざまな音色や言語効果を素早く試せるよう便利になりました。

よくある質問

Q: このQwen3-TTSアップデートのバージョン番号は何ですか?

A: これは2025年11月27日版で、音色の豊かさ、多言語性、自然さの面で重要なアップグレードが加えられています。

Q: 現在サポートされている言語や方言は何ですか?

A: 中国語、英語、ドイツ語、イタリア語、ポルトガル語、日本語、韓国語、フランス語、ロシア語を含む10言語に対応しており、多くの場所で福建語、呉語、広東語、中国語のアクセントもカバーしています。

Q: 一般ユーザーは新モデルをどのように体験していますか?

A: Qwen Chatの「Read and Reply」機能から直接聴くか、公式のオンラインデモページをご覧ください。

Q: リアルタイムAPIとオフラインAPIの違いは何ですか?

A: リアルタイムAPIは遅延に敏感なオンラインインタラクションシナリオに適しており、オフラインAPIはバッチ生成やオフライン処理により適しており、自社サービスへの統合が容易です。

Q: 開発者はどのようにしてQwen3-TTSをアプリケーションに統合できますか?

A: アリババCloud ModelStudioが提供するリアルタイムまたはオフラインAPIにアクセスし、ドキュメントに従ってモデルパラメータや認証情報を設定できます。

Qwen3-TTSは最新バージョンをリリース:49+の新しい音声と多言語・多方言対応

関連記事

LongCat-Imageオープンソース解析:6B DiTが20B+ MoEレベルの中国語・英語バイリンガル画像間モデルを達成

Z.ai GLM-4.6Vのビジュアル推論モデルをリリースし、ネイティブ関数呼び出しと無料のFlashバージョンを提供しました

Kimi K3公式発表:2.8兆のパラメータが数百万のコンテキストとオープンウェイトに賭けられます

Mistral Studioがプロンプトバージョン管理を追加:エンタープライズAIが行動資産を管理しています

おすすめツール

Qwen3-TTSは最新バージョンをリリース:49+の新しい音声と多言語・多方言対応

関連記事

LongCat-Imageオープンソース解析:6B DiTが20B+ MoEレベルの中国語・英語バイリンガル画像間モデルを達成

Z.ai GLM-4.6Vのビジュアル推論モデルをリリースし、ネイティブ関数呼び出しと無料のFlashバージョンを提供しました

Kimi K3公式発表:2.8兆のパラメータが数百万のコンテキストとオープンウェイトに賭けられます

Mistral Studioがプロンプトバージョン管理を追加:エンタープライズAIが行動資産を管理しています

おすすめツール

AIツールを投稿

投稿情報を確認してください