Googleは、
Geminiの翻訳および音声機能をGoogle翻訳に導入し、同時にGemini 2.5シリーズのテキスト読み上げおよびネイティブ音声モデルをアップデートすると発表しました。 Google翻訳は「ヘッドセットリアルタイム音声翻訳」のベータ体験を開始します。これは会話中や連続聴取の場面でリアルタイム翻訳が可能で、話者のトーン、アクセント、リズムを保つことで「人が話す」ように翻訳を試みます。
ベータ体験は、アメリカ、メキシコ、インドでAndroid上でバッチ配信されており、あらゆるヘッドセットに対応し、70以上の言語に対応しています。 Googleは2026年により多くの国や地域でiOSへの展開も発表しました。 同時に、Google DeepMindは12月10日にGemini 2.5 Flashおよび2.5 Pro向けのテキスト読み上げプレビューアップデートをリリースし、スタイルキューへの適合度向上、文脈に応じた音声速度や一時停止の自動調整、そして多文字対話における「キャラクター音色の一貫性」の向上を強調し、ポッドキャスト、吹き替え、教育、カスタマーサービスなどのマルチスピーカーシナリオに適しています。
リアルタイム音声インタラクションの面でも、Gemini 2.5 Flash Native Audioは複雑なプロセスの処理、ユーザー指示の遵守、自然な多ターン会話の維持に注力し、Google AI Studio、Vertex AIなどの製品に関連機能ポータルを提供しています。 ただし、上記の新機能の多くはまだベータやプレビュー段階であり、誤訳やアクセントのずれ、スタイルの不安定さなどの問題が残っている可能性があるため、使用時にはプライバシーや環境ノイズの影響に注意を払う必要があります。
よくある質問
Q: Google翻訳のヘッドホンリアルタイム翻訳の機能は何ですか?
A: Google翻訳はベータ版でリアルタイム音声翻訳を提供しており、ヘッドホンをつけながら聞きながら話し言葉のトーンやリズムを保つことができます。
Q: Google翻訳のリアルタイム翻訳はどの地域で最初にリリースされますか?
A: ベータ版は米国、メキシコ、インド、その他のAndroid地域でバッチ配信され、2026年にはiOSやより多くの国・地域へ拡大する予定です。
Q: Google翻訳のヘッドセットリアルタイム翻訳はどの言語に対応していますか?
A: ベータ版は70以上の言語をサポートするとされており、利用可能な言語は地域やバージョンによって徐々に更新されます。
Q: Gemini 2.5 Flashおよび2.5 Proのテキスト読み上げアップデートで何が変更されましたか?
A: 今回のアップデートの焦点は、スタイルの合図により良く合わせること、スピードや間取りをより「文脈的」にし、マルチスピーカーシーンでのキャラクターの声調をより一貫させることです。
Q: Gemini 2.5 Flash Native Audioアップデートはどのような用途に適していますか?
A: このアップデートはリアルタイムの音声エージェントおよび会話アプリケーションを対象としており、より強力な命令遵守、複数ラウンドの会話の整合性、複雑なタスク処理能力を強調しています。