Alibaba Tongyiチームは、次世代の音声合成モデルであるQwen3-TTS ( Qwen3-TTS-Flash版を含む)のリリースを発表しました。このモデルは、マルチ音色、マルチ言語、マルチ方言合成を特徴とし、より自然で表現力豊かな音声出力を実現します。公式デモとブログ記事では、英語と中国語の両方のシナリオにおけるこのモデルの卓越したパフォーマンスが実証されています。新しい統合アーキテクチャにより、同一モデル内で多言語・多方言をサポートできるようになりました。オンラインデモとアクセスガイドは、現在公開中です。
付属の製品ドキュメントとコンソールページによると、Qwen3-TTS-Flashは17種類の擬人化音声を提供し、同じ音声で複数の言語と方言(北京語やその他の方言を含む)を出力でき、API課金仕様も提供している。また、エンドツーエンドの遅延を削減するリアルタイム音声合成オプション(Qwen3-TTS Realtime)も提供している。メディア報道では、Qwen3-TTSとQwen3-Omniの同日リリースが並置され、これらがTongyiマルチモーダルファミリーの重要なアップデートであることを強調している。
よくある質問
Q: Qwen3-TTS のコア機能は何ですか?
A: 複数の声調、言語、方言を統合し、英語と中国語の自然さと表現力を重視し、オンラインデモと API アクセスを提供します。
Q: Qwen-TTS との違いは何ですか?
A: 公式ドキュメントでは、より広範囲のトーンと言語(複数の方言を含む)をカバーし、Flash 形式と Realtime 形式で利用できる Qwen3-TTS の使用を推奨しています。
Q: 重量はオープンソースですか?
A: 現在、主にAPIとオンラインデモを利用しており、その重みは非公開です。使用方法については、公式インターフェースとコンソールをご参照ください。
Q: どのような言語/方言やトーンがサポートされていますか?
A: このドキュメントでは、中国語(一部の方言を含む)と複数の外国語を網羅した 17 種類の声調が提供されています。詳細なリストと価格については、製品ページをご覧ください。
Q: どこで体験したりアップデートを入手したりできますか?
A: 公式ブログ/デモページで体験でき、Alibaba Cloud Tongyi Qianwen 製品ドキュメントでモデルとリアルタイム音声オプションをご覧いただけます。