戻るAI情報
GoogleがGeminiオーディオモデルの新開発を発表:リアルタイム翻訳、TTSプレビュー、ネイティブオーディオアップデートを翻訳

GoogleがGeminiオーディオモデルの新開発を発表:リアルタイム翻訳、TTSプレビュー、ネイティブオーディオアップデートを翻訳

AI情報 Admin 147 回閲覧

Googleは、

Geminiの翻訳および音声機能をGoogle翻訳に導入し、同時にGemini 2.5シリーズのテキスト読み上げおよびネイティブ音声モデルをアップデートすると発表しました。 Google翻訳は「ヘッドセットリアルタイム音声翻訳」のベータ体験を開始します。これは会話中や連続聴取の場面でリアルタイム翻訳が可能で、話者のトーン、アクセント、リズムを保つことで「人が話す」ように翻訳を試みます。

ベータ体験は、アメリカ、メキシコ、インドでAndroid上でバッチ配信されており、あらゆるヘッドセットに対応し、70以上の言語に対応しています。 Googleは2026年により多くの国や地域でiOSへの展開も発表しました。 同時に、Google DeepMindは12月10日にGemini 2.5 Flashおよび2.5 Pro向けのテキスト読み上げプレビューアップデートをリリースし、スタイルキューへの適合度向上、文脈に応じた音声速度や一時停止の自動調整、そして多文字対話における「キャラクター音色の一貫性」の向上を強調し、ポッドキャスト、吹き替え、教育、カスタマーサービスなどのマルチスピーカーシナリオに適しています。

リアルタイム音声インタラクションの面でも、Gemini 2.5 Flash Native Audioは複雑なプロセスの処理、ユーザー指示の遵守、自然な多ターン会話の維持に注力し、Google AI Studio、Vertex AIなどの製品に関連機能ポータルを提供しています。 ただし、上記の新機能の多くはまだベータやプレビュー段階であり、誤訳やアクセントのずれ、スタイルの不安定さなどの問題が残っている可能性があるため、使用時にはプライバシーや環境ノイズの影響に注意を払う必要があります。

よくある質問

Q: Google翻訳のヘッドホンリアルタイム翻訳の機能は何ですか?

A: Google翻訳はベータ版でリアルタイム音声翻訳を提供しており、ヘッドホンをつけながら聞きながら話し言葉のトーンやリズムを保つことができます。

Q: Google翻訳のリアルタイム翻訳はどの地域で最初にリリースされますか?

A: ベータ版は米国、メキシコ、インド、その他のAndroid地域でバッチ配信され、2026年にはiOSやより多くの国・地域へ拡大する予定です。

Q: Google翻訳のヘッドセットリアルタイム翻訳はどの言語に対応していますか?

A: ベータ版は70以上の言語をサポートするとされており、利用可能な言語は地域やバージョンによって徐々に更新されます。

Q: Gemini 2.5 Flashおよび2.5 Proのテキスト読み上げアップデートで何が変更されましたか?

A: 今回のアップデートの焦点は、スタイルの合図により良く合わせること、スピードや間取りをより「文脈的」にし、マルチスピーカーシーンでのキャラクターの声調をより一貫させることです。

Q: Gemini 2.5 Flash Native Audioアップデートはどのような用途に適していますか?

A: このアップデートはリアルタイムの音声エージェントおよび会話アプリケーションを対象としており、より強力な命令遵守、複数ラウンドの会話の整合性、複雑なタスク処理能力を強調しています。

Google翻訳がヘッドホン向けにリアルタイム音声翻訳体験を開始 ベータヘッドセット翻訳は、Google翻訳をよりリアルな人間の会話のようにします AndroidのGoogle翻訳がヘッドホンのリアルタイム翻訳をバッチで開始 Google翻訳ヘッドセットのリアルタイム翻訳は70言語以上をカバーしています Googleは、Geminiの機能がGoogle翻訳に深く統合されていると発表しました GoogleはGeminiを使ってトーンとアクセントを保ち、翻訳の自然さを向上させています Google翻訳のリアルタイム音声翻訳は会話シナリオに適しています Google翻訳の連続聴取モードは、聴きながら聴くことと翻訳を実現します Google翻訳はトーン、リズム、アクセントの再現を強調しています Google翻訳ベータ版にはアクセントバイアスの誤訳がある可能性があるため、注意してください Google翻訳は2026年により多くの国や地域にiOSを拡大 Google DeepMindがGemini 2.5 TTSプレビューアップデートをリリース Gemini 2.5のFlashテキスト読み上げ機能はスタイルプロンプトにより近いです Gemini 2.5 Pro テキスト読み上げが多機能の一貫性を向上させる GoogleがGemini 2.5シリーズのネイティブオーディオモデル機能を更新 Gemini 2.5 TTSは、状況に応じて自動的に話す速度と一時停止を調整します Gemini 2.5 TTSはポッドキャストの吹き替えや教育シナリオに適しています Gemini 2.5 TTSはマルチスピーカーのキャラクター音色安定化を強化 Google AI StudioはGemini 2.5オーディオ機能ポータルを提供しています Vertex AIがGemini 2.5のネイティブオーディオ関連機能をリリース Gemini 2.5 フラッシュネイティブオーディオ強化命令の準拠 Gemini 2.5 ネイティブオーディオは、自然なマルチターン音声会話をサポートします 音声エージェントアプリケーション向けGoogleリアルタイム音声インタラクションアップグレード Google翻訳は専用デバイスがなくても、どんなヘッドセットでも対応します Google翻訳ヘッドセットのリアルタイム翻訳は、アメリカ合衆国、メキシコ、インドで利用可能です Google翻訳の新機能はプライバシーや環境騒音への影響を考慮しています Google翻訳のリアルタイム翻訳により、言語間のコミュニケーションがよりスムーズになります Google翻訳ベータ体験は、旅行会議やネットワーキングに利用できます Google翻訳は即時の音声間出力に重点を置いています Google翻訳は、まるで彼らが話しているかのように翻訳をレンダリングします Google DeepMindはTTSスタイルのプロンプト理解をより正確に重視しています Gemini 2.5 TTSは文脈的な間や感情の把握を向上させます 複数キャラクターの会話はGemini 2.5を使って声の一貫性を保っています GoogleはGeminiのオーディオ機能を商品化に向けて推進しています Google翻訳とGeminiは協力して音声翻訳体験を向上させています Google翻訳ヘッドセットのリアルタイム翻訳は、連続的な聴取シナリオに適しています Google翻訳のリアルタイム翻訳は、アクセントやノイズによって妨げられることがあります Googleはプライバシーと環境を考慮して翻訳するためにヘッドホンの使用を推奨しています Gemini 2.5 Flash ネイティブオーディオは複雑な処理に優れています Gemini 2.5 Native Audioは音声アプリケーションをより一貫性があり自然なものにします GoogleがAI Studioでリアルタイム音声モデル機能のアップデートを発表 Vertex AI開発者はGemini 2.5のオーディオ機能を呼び出すことができます Google翻訳ヘッドセット翻訳ベータ版は70以上の言語に対応しています Google翻訳が新モデルを発表、言語間コミュニケーションの参入障壁を下げる GoogleはTTSをGeminiでアップグレードし、カスタマーサービスとマルチスピーカー対応を図る Google翻訳の新しいベータ版はリアルタイム翻訳をより口語的にします Google翻訳ヘッドセットのリアルタイム翻訳は、対話モードとリスニングモードの両方をサポートしています Vouseのポッドキャストやチュートリアルについては、Gemini 2.5のTTSアップデートで検索してみてください。 Google翻訳ヘッドセット翻訳は、Geminiオーディオアップグレードと連動してリリースされました

おすすめツール

もっと見る