Das Tongyi-Team von Alibaba veröffentlichte eine neue Version des Sprachsynthesemodells Qwen3-TTS (27.11.2025), die sich auf umfassende Verbesserungen in Bezug auf Klangfülle, Mehrsprachigkeit und Natürlichkeit konzentriert. Offiziell bietet diese Version mehr als 49 hochwertige Töne, von lebendig und niedlich bis hin zu stabil und ernst, deckt eine Vielzahl von Anwendungsszenarien ab, und Nutzer können den Klang wählen, der besser zur Marke und dem Inhaltstemperament passt, entsprechend ihren Bedürfnissen.
Was Sprach- und Dialektunterstützung betrifft, deckt die neue Version von Qwen3-TTS zehn Sprachen ab: Chinesisch, Englisch, Deutsch, Italienisch, Portugiesisch, Spanisch, Japanisch, Koreanisch, Französisch und Russisch und ergänzt Hokkien, Wu, Kantonesisch sowie Sichuan, Peking, Nanjing, Tianjin, Shaanxi und andere lokale Akzente. Die Steuerung von Sprachgeschwindigkeit, Pausen und Ton durch das Modell wird weiter verfeinert, wobei die Fähigkeit betont wird, den Rhythmus automatisch an Text und Kontext anzupassen, was das "Realitätsgefühl" verstärkt.
Qwen3-TTS wird nun direkt über die Funktion "Read and Reply" von Qwen Chat erlebt und öffnet gleichzeitig Echtzeit-APIs sowie Offline-APIs, was es Entwicklern erleichtert, Sprachfunktionen in verschiedene Anwendungen einzubetten. Der Offizielle hat außerdem eine Online-Demo in der Hugging Face and Magic Partnership Community veröffentlicht, was es den Nutzern erleichtert, schnell verschiedene Klangfarben und Spracheffekte auszuprobieren.
Häufig gestellte Fragen F
: Wie lautet die Versionsnummer dieses Qwen3-TTS-Updates?
A: Dies ist die Version vom 27.11.2025, die wichtige Verbesserungen hinsichtlich Klangfarbe, Mehrsprachigkeit und Natürlichkeit vorgenommen hat.
F: Welche Sprachen und Dialekte werden derzeit unterstützt?
A: Es unterstützt 10 Sprachen, darunter Chinesisch, Englisch, Deutsch, Italienisch, Portugiesisch, Japanisch, Koreanisch, Französisch und Russisch, und deckt an vielen Orten Hokkien, Wu, Kantonesisch und chinesische Akzente ab.
F: Wie erleben normale Nutzer das neue Modell?
A: Sie können Qwen Chat direkt über die Funktion "Lesen und Antworten" hören oder die offizielle Online-Demo-Seite besuchen.
F: Was ist der Unterschied zwischen der Echtzeit-API und der Offline-API?
A: Die Echtzeit-API eignet sich für latenzempfindliche Online-Interaktionsszenarien, während die Offline-API eher für Batch-Erstellung oder Offline-Verarbeitung geeignet ist, was die Integration in eigene Dienste erleichtert.
F: Wie können Entwickler Qwen3-TTS in ihre Anwendungen integrieren?
A: Sie können auf die Echtzeit- oder Offline-API zugreifen, die von Alibaba Cloud ModelStudio bereitgestellt wird, und die Modellparameter sowie Authentifizierungsinformationen entsprechend dem Dokument konfigurieren.