GLM-TTS 全面开源:3 秒音色克隆与情绪可控的工业级语音合成 一、摘要 GLM-TTS 是面向工业级语音生成的开源 TTS 系统,支持仅 3 秒语音样本的音色克隆,并提供可控的情绪表达能力。其架构采用两阶段生成流程,并引入基于 GRPO 的强化学习机制,在字符错误率(CER)与情感维度达到开源领先水平。项目强调低训练成本与高可扩展性,适用于教育、电子书、有声内... Ai开源 • Admin • 2025/12/11 153