阿里巴巴通义团队发布新版本语音合成模型 Qwen3-TTS(2025-11-27),重点围绕音色丰富度、多语种与自然度进行了全面升级。官方称,本次版本提供超过 49 种高质量音色,从活泼可爱到稳重严肃,覆盖多类应用场景,用户可按需求选择更贴合品牌与内容气质的声音。
在语言与方言支持方面,新版 Qwen3-TTS 已覆盖中文、英语、德语、意大利语、葡萄牙语、西班牙语、日语、韩语、法语和俄语十种语言,同时新增闽南话、吴语、粤语及四川、北京、南京、天津、陕西等多种地方口音。模型在语速、停顿和语气上的控制进一步细化,强调能根据文本与语境自动调整节奏,提升“真人感”。
Qwen3-TTS 现已通过 Qwen Chat 的“朗读回复”功能直接体验,并同步开放实时 Realtime API 与离线 Offline API,便于开发者将语音能力嵌入各类应用。官方还在 Hugging Face 与魔搭社区上线在线 Demo,方便用户快速试听不同音色和语言效果。
常见问题
Q:这次 Qwen3-TTS 更新的版本号是什么?
A:为 2025-11-27 版本,对音色数量、多语种与自然度等方面进行了重要升级。
Q:目前支持哪些语言和方言?
A:支持 10 种语言,包括中英德意葡西、日语、韩语、法语和俄语,并覆盖闽南话、吴语、粤语及多地中文口音。
Q:普通用户如何体验新模型?
A:可以在 Qwen Chat 中通过“朗读回复”功能直接试听,也可访问官方提供的在线 Demo 页面。
Q:Realtime API 与 Offline API 有什么区别?
A:Realtime API 适合对时延敏感的在线交互场景,Offline API 更适合批量生成或离线处理,方便在自有服务中集成。
Q:开发者如何将 Qwen3-TTS 集成到自己的应用?
A:可通过阿里云 ModelStudio 提供的实时或离线 API 接入,根据文档配置模型参数和鉴权信息即可调用。