返回AI资讯
通义千问发布 Qwen3-TTS-Flash:英中双强,统一架构支持 17 种音色

通义千问发布 Qwen3-TTS-Flash:英中双强,统一架构支持 17 种音色

AI资讯 Admin 96 次浏览

阿里通义团队宣布推出新一代文本转语音模型 Qwen3-TTS(含 Qwen3-TTS-Flash 变体),主打多音色(multi-timbre)、多语种与多方言合成,强调更自然、富有表现力的语音输出。官方演示与博客显示,模型在英文与中文场景表现突出,并新增统一架构以在同一模型内覆盖多语与多方言。当前已开放在线 Demo 与接入说明。

配套产品文档与控制台页面显示,Qwen3-TTS-Flash 提供 17 种拟人音色,可在同一音色下输出多语言与多方言(普通话及部分方言等),并提供 API 计费规格;同时提供实时语音合成选项(Qwen3-TTS Realtime)以降低端到端延迟。媒体报道亦将 Qwen3-TTS 与 Qwen3-Omni 的当日发布并列,构成通义多模态家族的关键更新。

常见问题

Q:Qwen3-TTS 有哪些核心特性?

A:多音色、多语种、多方言统一合成,强调英文与中文的自然度与表达力,并提供在线演示与 API 接入。

Q:与 Qwen-TTS 有何区别?

A:官方文档推荐使用 Qwen3-TTS,音色与语种覆盖更广(含多方言),并有 Flash 与 Realtime 等形态。

Q:是否开源权重?

A:当前以 API 与在线 Demo 为主,权重未公开;使用以官方接口与控制台为准。

Q:支持哪些语言/方言与音色?

A:文档给出 17 种音色,覆盖中文(含部分方言)与多种外语;具体清单与价格见产品页。

Q:哪里体验与获取更新?

A:可在官方博客/演示页体验,在阿里云通义千问产品文档查看模型与实时语音选项。

推荐工具

更多