返回AI资讯
Google 推出 Gemini 音频模型新进展:Translate 实时翻译、TTS 预览版与 Native Audio 更新

Google 推出 Gemini 音频模型新进展:Translate 实时翻译、TTS 预览版与 Native Audio 更新

AI资讯 Admin 147 次浏览

Google 宣布把 Gemini 的翻译与音频能力更深度带入 Google Translate,并同步更新 Gemini 2.5 系列的文本转语音与原生音频模型。Google Translate 将推出“耳机实时语音到语音翻译”的 Beta 体验,可在对话或持续收听场景下进行实时翻译,并尽量保留说话者的语气、重音与节奏,让译文更像“人在说话”。

该 Beta 体验已在 Android 端的美国、墨西哥和印度等地区分批开放,支持任意耳机,并覆盖 70 多种语言;Google 也表示将在 2026 年扩展到 iOS 与更多国家和地区。与此同时,Google DeepMind 在 12 月 10 日发布 Gemini 2.5 Flash 与 2.5 Pro 的 Text-to-Speech 预览版更新,强调对风格提示更贴合、可按语境自动调节语速与停顿,并提升多角色对话时的“角色音色一致性”,适用于播客、配音、教学与客服等多说话人场景。

在实时语音交互方面,Gemini 2.5 Flash Native Audio 也获得更新,主打更好地处理复杂流程、遵循用户指令与保持自然多轮对话,并已在 Google AI Studio、Vertex AI 等产品中提供相关能力入口;不过上述新功能多处于 Beta/Preview 阶段,仍可能出现误译、口音偏差或风格不稳定等问题,使用时需留意隐私与环境噪声对效果的影响。

常见问题

Q:Google Translate 的耳机实时翻译是什么功能?

A:Google Translate 在 Beta 中提供实时语音到语音翻译,可在佩戴耳机时边听边译,并尽量保留说话语气与节奏。

Q:Google Translate 的耳机实时翻译在哪些地区先上线?

A:该 Beta 先在 Android 端的美国、墨西哥、印度等地区分批开放,并计划在 2026 年扩展到 iOS 与更多国家地区。

Q:Google Translate 的耳机实时翻译支持哪些语言?

A:该 Beta 宣称支持 70 多种语言,具体可用语言会随地区与版本逐步更新。

Q:Gemini 2.5 Flash 与 2.5 Pro 的 Text-to-Speech 更新改了什么?

A:更新重点是更贴合风格提示、语速与停顿更“懂语境”,以及多说话人场景下的角色音色更一致。

Q:Gemini 2.5 Flash Native Audio 更新适合什么用途?

A:该更新面向实时语音代理与对话应用,强调更强的指令遵循、多轮对话连贯性与复杂任务流程处理能力。

Google Translate 推出耳机实时语音翻译体验 Beta 耳机翻译让 Google Translate 更像真人对话 Android 端 Google Translate 分批上线耳机实时翻译 Google Translate 耳机实时翻译覆盖七十多种语言 Google 宣布 Gemini 能力深度融入 Google Translate Google 用 Gemini 保留语气重音提升翻译自然度 Google Translate 实时语音到语音翻译适合对话场景 Google Translate 持续收听模式实现边听边译 Google Translate 耳机翻译强调语气节奏与重音还原 Google Translate Beta 或出现误译口音偏差需注意 Google Translate 2026 年扩展 iOS 与更多国家地区 Google DeepMind 发布 Gemini 2.5 TTS 预览更新 Gemini 2.5 Flash Text to Speech 更贴合风格提示 Gemini 2.5 Pro Text to Speech 提升多角色一致性 Google 更新 Gemini 2.5 系列原生音频模型能力 Gemini 2.5 TTS 可按语境自动调语速与停顿 Gemini 2.5 TTS 适用于播客配音与教学场景 Gemini 2.5 TTS 强化多说话人角色音色稳定 Google AI Studio 提供 Gemini 2.5 音频能力入口 Vertex AI 上线 Gemini 2.5 原生音频相关能力 Gemini 2.5 Flash Native Audio 强化指令遵循 Gemini 2.5 Native Audio 支持自然多轮语音对话 Google 实时语音交互升级面向语音代理应用 Google Translate 耳机翻译支持任意耳机无需专用设备 Google Translate 耳机实时翻译在美国墨西哥印度开放 Google Translate 新功能兼顾隐私与环境噪声影响 Google Translate 实时翻译让跨语言沟通更顺畅 Google Translate Beta 体验可用于旅行会议与交流 Google Translate 耳机翻译主打语音到语音即时输出 Google Translate 将译文呈现为更像人在说话 Google DeepMind 强调 TTS 风格提示理解更准确 Gemini 2.5 TTS 提升对语境停顿与情绪的把握 多角色对话用 Gemini 2.5 保持人物声线一致 Google 推动 Gemini 音频能力走向产品化落地 Google Translate 与 Gemini 协同升级语音翻译体验 Google Translate 耳机实时翻译适合持续收听场景 Google Translate 实时翻译可能受口音与噪声干扰 Google 建议使用耳机翻译时留意隐私与环境 Gemini 2.5 Flash Native Audio 擅长复杂流程处理 Gemini 2.5 Native Audio 让语音应用更连贯自然 Google 在 AI Studio 释放实时语音模型能力更新 Vertex AI 开发者可调用 Gemini 2.5 音频功能 Google Translate 耳机翻译 Beta 覆盖七十多语言体系 Google Translate 推出新模式降低跨语沟通门槛 Google 以 Gemini 升级 TTS 适配客服与多说话人 Google Translate 新 Beta 让实时翻译更口语化 Google Translate 耳机实时翻译支持对话与收听两模式 Google Gemini 2.5 TTS 更新面向配音播客与教学 Google Translate 耳机翻译与 Gemini 音频升级同步发布

推荐工具

更多