オープンソース音声ソリューションの比較:Fun-CosyVoice3と一般的なTTS、Fun-ASR-nanoと主流のASRの比較
1. 要約 アリババ通義ボイスチーム(FunAudioLLM)は、音声合成用のFun-CosyVoice3-0.5B-2512(TTS)と音声認識用のFun-ASR-Nano-2512(ASR)という2種類のオーディオモデルをオープンソース化しています。 前者は多言語のゼロショット音声クローンと低遅...
AIはオープンソースです • Admin •
514