Das Team von Tencent Hunyuan hat die offizielle Veröffentlichung der neuesten Version des Sprachmodells, Tencent HY 2.0, angekündigt, die Entwicklern und Unternehmen über die Tencent Cloud API offensteht. Dieses Upgrade verwendet eine hybride Expertenarchitektur (MoE) mit einer Gesamtparameterskala von 406 Milliarden, Aktivierungsparametern von 32 Milliarden und unterstützt maximal 256.000 Kontextfenster, was im Vergleich zum vorherigen Modell deutlich in mathematischem Denken, Codegenerierung und komplexer Aufgabenausführung verbessert ist. Laut der offiziellen Einführung erzielte HY 2.0 73,4 Punkte auf IMO-AnswerBench, und auch die Punktzahl bei Agentenaufgaben wie SWE-bench Verified und Tau2-Bench stieg deutlich an.
HY 2.0 bietet zwei Arten optimierter Versionen: Tencent HY 2.0 Think richtet sich an tiefgehendes Denken, Codegenerierung und komplexen Befehlsszenarien, und die Cloud-Schnittstelle unterstützt derzeit maximal 128K und 64K mit Fokus auf lange Texte, mehrrundige Dialoge und schwierige Denkfähigkeiten; Tencent HY 2.0 Instruct richtet sich an tägliche Gespräche, Erstellung und hochzeitige Dienste, mit einem maximalen Input von 128K und einem Output von 16K, wobei Reaktionsfähigkeit und universelle Stabilität betont werden. Was die Trainingsstrategie betrifft, betont der Beamte die Einführung von RLVR + RLHF Zweistufigem Verstärkungslernen und balanciert "Denktiefe" und Generierungseffizienz durch Längenstrafe und Aufgaben-Sandbox-Design.
Derzeit ist HY 2.0 mit eigenen Anwendungen wie Tencent Yuanbao verbunden und bietet API-Aufrufe sowie Unternehmenszugriffsfunktionen auf Tencent Cloud. Der genaue Preis, die aktuelle Grenzstrategie und weitere technische Details unterliegen weiterhin der offiziellen Dokumentation von Tencent Cloud, und die Originaldaten einiger interner Benchmarks wurden noch nicht vollständig veröffentlicht; der externe Leistungsvergleich basiert hauptsächlich auf den von Tencent veröffentlichten Indikatoren und Anweisungen.
FAQ
F: Was ist Tencent HY 2.0?
A: Es ist die neueste Generation des allgemeinen großen Sprachmodells von Tencent Hunyuan, das eine MoE-Architektur verwendet, mit Gesamtparametern von 406B und einer Aktivierung von 32B, mit Fokus auf Argumentation, Code und Langtextfähigkeiten.
F: Welche konkreten Versionen dieser Veröffentlichung gibt es?
A: Es gibt zwei Haupttypen von Textmodellen: Tencent HY 2.0 Think (für tiefgehendes Denken) und Tencent HY 2.0 Instruct (für allgemeine Dialoge und Autoren).
F: Wie sind die Kontextlänge und die Ein-/Ausgabe-Spezifikationen von HY 2.0?
A: Das Familienmodell behauptet, bis zu 256K Kontext zu unterstützen, und der aktuelle maximale Eingang der Cloud-Think/Instruct-Schnittstelle beträgt 128K, wobei der maximale Output von Think 64K und der maximale Output von Instruct 16K beträgt.
F: Was ist der Hauptunterschied zwischen Think und Instruct?
A: Denken eignet sich besser für "langsam denkende" Aufgaben wie komplexes Denken, Codegenerierung und Agenten-Tool-Aufrufe. Instruct eignet sich besser für Chats, Schreiben und geschäftliche Frage-und-Antwort-Szenarien mit hoher Nebenläufigkeit und hohen Antwortanforderungen.
F: Ist es komplett Open Source, wie kann man darauf zugreifen und es nutzen?
A: HY 2.0 bietet derzeit kommerzielle Dienstleistungen in Form der Tencent Cloud API an und wurde in einigen Tencent-Produkten implementiert.