알리바바 통이(Alibaba Tongyi) 팀은 차세대 텍스트 음성 변환 모델인 Qwen3-TTS ( Qwen3-TTS-Flash 버전 포함) 출시를 발표했습니다. 이 모델은 다중 음색, 다중 언어 및 다중 방언 합성 기능을 제공하여 더욱 자연스럽고 풍부한 음성 출력을 지원합니다. 공식 데모와 블로그 게시물을 통해 영어와 중국어 시나리오 모두에서 이 모델의 탁월한 성능을 확인할 수 있습니다. 새로운 통합 아키텍처는 동일한 모델 내에서 다중 언어 및 다중 방언 지원을 제공합니다. 온라인 데모와 사용 설명서도 지금 바로 이용 가능합니다.
동봉된 제품 설명서와 콘솔 페이지에 따르면 Qwen3-TTS-Flash는 17가지 의인화된 음성을 제공하고, 동일한 음성으로 여러 언어와 방언(중국어 및 기타 방언 포함)을 출력할 수 있으며, API 과금 사양을 제공합니다. 또한, 엔드투엔드 지연 시간을 줄이기 위한 실시간 음성 합성 옵션(Qwen3-TTS Realtime)을 제공합니다. 언론 보도에서도 Qwen3-TTS와 Qwen3-Omni의 동시 출시를 비교하며, 두 제품이 Tongyi 멀티모달 제품군의 주요 업데이트임을 강조했습니다.
자주 묻는 질문
질문: Qwen3-TTS의 핵심 기능은 무엇인가요?
A: 다양한 음조, 언어, 방언을 통합하고, 영어와 중국어의 자연스러움과 표현력을 강조하며, 온라인 데모와 API 접근을 제공합니다.
질문: Qwen-TTS와의 차이점은 무엇인가요?
답변: 공식 문서에서는 더 광범위한 톤과 언어(여러 방언 포함)를 지원하고 Flash와 Realtime 형식으로 제공되는 Qwen3-TTS를 사용할 것을 권장합니다.
질문: 무게는 오픈 소스인가요?
A: 현재 API와 온라인 데모가 주로 사용되고 있으며, 구체적인 내용은 공개되지 않았습니다. 사용 방법은 공식 인터페이스와 콘솔을 참조해 주시기 바랍니다.
질문: 어떤 언어/방언과 톤이 지원되나요?
답변: 이 문서는 중국어(일부 방언 포함)와 여러 외국어를 포함하여 17개 음조를 제공합니다. 자세한 목록과 가격은 제품 페이지에서 확인하세요.
질문: 어디서 체험하고 최신 소식을 얻을 수 있나요?
답변: 공식 블로그/데모 페이지에서 체험해 보실 수 있으며, Alibaba Cloud Tongyi Qianwen 제품 설명서에서 모델과 실시간 음성 옵션을 확인하실 수 있습니다.