알리바바의 통이 팀은 음성 합성 모델 Qwen3-TTS의 새로운 버전을 2025-11-27 발표했으며, 음색의 풍부함, 다국어 사용성, 자연스러움에 대한 포괄적인 업그레이드에 중점을 두었습니다. 공식적으로 이 버전은 활기차고 귀엽고 안정적이며 진지한 톤까지 49가지 이상의 고품질 음색을 제공하며, 다양한 응용 시나리오를 아우르며, 사용자는 자신의 필요에 따라 브랜드와 콘텐츠 성향에 더 잘 맞는 사운드를 선택할 수 있습니다.
언어 및 방언 지원 측면에서 Qwen3-TTS의 새 버전은 중국어, 영어, 독일어, 이탈리아어, 포르투갈어, 스페인어, 일본어, 한국어, 프랑스어, 러시아어 등 10개 언어를 포함했으며, 복건어, 우, 광둥어, 쓰촨어, 베이징, 난징, 톈진, 산시어 등 다양한 지역 억양도 추가되었습니다. 모델의 말 속도, 일시정지, 톤 제어는 더욱 정교해져, 텍스트와 맥락에 따라 리듬을 자동으로 조절하는 능력을 강조하여 "현실감"을 강화합니다.
Qwen3-TTS는 이제 Qwen Chat의 '읽고 답장하기' 기능을 통해 직접 경험할 수 있으며, 실시간 API와 오프라인 API를 동시에 열어 개발자들이 다양한 애플리케이션에 음성 기능을 쉽게 내장할 수 있게 합니다. 공식 사이트는 또한 Hugging Face와 Magic Partnership 커뮤니티에 온라인 데모를 공개하여 사용자가 다양한 음색과 언어 효과를 빠르게 체험할 수 있도록 했습니다.
자주 묻는 질문
: 이번 Qwen3-TTS 업데이트의 버전 번호는 무엇인가요?
A: 이것은 2025-11-27 버전으로, 음색 양, 다국어 사용성, 자연스러움 측면에서 중요한 업그레이드를 이루어 놓았습니다.
Q: 현재 지원되는 언어와 방언은 무엇인가요?
답변: 중국어, 영어, 독일어, 이탈리아어, 포르투갈어, 일본어, 한국어, 프랑스어, 러시아어 등 10개 언어를 지원하며, 여러 지역에서 복건어, 우, 광둥어, 중국어 억양을 다룹니다.
Q: 일반 사용자들은 새 모델을 어떻게 느끼나요?
A: '읽고 답장하기' 기능을 통해 Qwen Chat을 직접 들을 수 있고, 공식 온라인 데모 페이지를 방문할 수도 있습니다.
Q: 실시간 API와 오프라인 API의 차이점은 무엇인가요?
A: 실시간 API는 지연에 민감한 온라인 상호작용 시나리오에 적합하며, 오프라인 API는 배치 생성이나 오프라인 처리에 더 적합하여 자신의 서비스에 쉽게 통합할 수 있습니다.
Q: 개발자들은 Qwen3-TTS를 어떻게 애플리케이션에 통합할 수 있나요?
A: Alibaba Cloud ModelStudio에서 제공하는 실시간 또는 오프라인 API에 접속하여 문서에 따라 모델 매개변수와 인증 정보를 설정할 수 있습니다.