通义千问发布 Qwen3-TTS-Flash：英中双强，统一架构支持 17 种音色

AI资讯 • Admin • 2025/9/23 • 115 次浏览

阿里通义团队宣布推出新一代文本转语音模型 Qwen3-TTS（含 Qwen3-TTS-Flash 变体），主打多音色（multi-timbre）、多语种与多方言合成，强调更自然、富有表现力的语音输出。官方演示与博客显示，模型在英文与中文场景表现突出，并新增统一架构以在同一模型内覆盖多语与多方言。当前已开放在线 Demo 与接入说明。

配套产品文档与控制台页面显示，Qwen3-TTS-Flash 提供 17 种拟人音色，可在同一音色下输出多语言与多方言（普通话及部分方言等），并提供 API 计费规格；同时提供实时语音合成选项（Qwen3-TTS Realtime）以降低端到端延迟。媒体报道亦将 Qwen3-TTS 与 Qwen3-Omni 的当日发布并列，构成通义多模态家族的关键更新。

常见问题

Q：Qwen3-TTS 有哪些核心特性？

A：多音色、多语种、多方言统一合成，强调英文与中文的自然度与表达力，并提供在线演示与 API 接入。

Q：与 Qwen-TTS 有何区别？

A：官方文档推荐使用 Qwen3-TTS，音色与语种覆盖更广（含多方言），并有 Flash 与 Realtime 等形态。

Q：是否开源权重？

A：当前以 API 与在线 Demo 为主，权重未公开；使用以官方接口与控制台为准。

Q：支持哪些语言/方言与音色？

A：文档给出 17 种音色，覆盖中文（含部分方言）与多种外语；具体清单与价格见产品页。

Q：哪里体验与获取更新？

A：可在官方博客/演示页体验，在阿里云通义千问产品文档查看模型与实时语音选项。

通义千问发布 Qwen3-TTS-Flash：英中双强，统一架构支持 17 种音色

相关文章

OpenAI 发布博文解读 Responses API：为 GPT-5 打造的“推理+工具”统一接口

“Token exchange failed: token endpoint returned status 403 Forbidden”怎么办？

Kimi K3正式上线：2.8万亿参数押注百万上下文与开放权重

Mistral Studio 新增提示词版本管理：企业 AI 开始管行为资产

推荐工具

通义千问发布 Qwen3-TTS-Flash：英中双强，统一架构支持 17 种音色

相关文章

OpenAI 发布博文解读 Responses API：为 GPT-5 打造的“推理+工具”统一接口

“Token exchange failed: token endpoint returned status 403 Forbidden”怎么办？

Kimi K3正式上线：2.8万亿参数押注百万上下文与开放权重

Mistral Studio 新增提示词版本管理：企业 AI 开始管行为资产

推荐工具

提交AI工具

请确认提交信息