GLM-TTS适配多场景拟真人语音生成

GLM-TTS 全面开源：3 秒音色克隆与情绪可控的工业级语音合成

一、摘要 GLM-TTS 是面向工业级语音生成的开源 TTS 系统，支持仅 3 秒语音样本的音色克隆，并提供可控的情绪表达能力。其架构采用两阶段生成流程，并引入基于 GRPO 的强化学习机制，在字符错误率（CER）与情感维度达到开源领先水平。项目强调低训练成本与高可扩展性，适用于教育、电子书、有声内...

Ai开源 • Admin • 2025/12/11

176

GLM-TTS适配多场景拟真人语音生成

GLM-TTS 全面开源：3 秒音色克隆与情绪可控的工业级语音合成

推荐工具

提交AI工具

请确认提交信息