Retour à Informations sur l’IA
Tencent HY 2.0 est officiellement dévoilé : mise à jour de l’architecture MoE, versions duales Think and Instruction sorties

Tencent HY 2.0 est officiellement dévoilé : mise à jour de l’architecture MoE, versions duales Think and Instruction sorties

Informations sur l’IA Admin 326 vues

L’équipe de Tencent Hunyuan a annoncé la sortie officielle de la dernière version du modèle de langage, Tencent HY 2.0, qui est ouverte aux développeurs et aux entreprises via l’API Tencent Cloud. Cette mise à niveau adopte une architecture hybride expert (MoE) avec une échelle totale de paramètres de 406 milliards, des paramètres d’activation de 32 milliards, et supporte un maximum de 256 000 fenêtres contextuelles, ce qui est nettement amélioré en raisonnement mathématique, génération de code et exécution de tâches complexes par rapport au modèle de génération précédente. Selon l’introduction officielle, HY 2.0 a obtenu 73,4 points sur IMO-AnswerBench, et son score sur des tâches d’agent telles que SWE-bench Verified et Tau2-Bench a également fortement augmenté.

HY 2.0 propose deux types de versions optimisées : Tencent HY 2.0 Think est destiné au raisonnement profond, à la génération de code et aux scénarios d’instructions complexes, et l’interface cloud prend actuellement en charge une entrée maximale de 128K et une sortie de 64K, en se concentrant davantage sur les textes longs, les dialogues à plusieurs tours et les capacités de raisonnement difficiles ; Tencent HY 2.0 Instruct vise les conversations quotidiennes, la création et les services à forte concurrence concurrente, avec une entrée maximale de 128K et une sortie de 16K, mettant l’accent sur la réactivité et la stabilité universelle. En ce qui concerne la stratégie d’entraînement, l’officiel met l’accent sur l’introduction de l’apprentissage par renforcement à double étape RLVR + RLHF, et équilibre la « profondeur de réflexion » et l’efficacité de génération grâce à la pénalité de longueur et la conception de la zone à sable de tâches.

Actuellement, HY 2.0 est connecté à ses propres applications telles que Tencent Yuanbao, et offre des appels API et des capacités d’accès aux entreprises sur Tencent Cloud. Le prix spécifique, la stratégie de limitation actuelle et les détails techniques supplémentaires sont encore soumis à la documentation officielle de Tencent Cloud, et les données originales de certains benchmarks internes n’ont pas encore été entièrement divulguées, la comparaison de performance externe étant principalement basée sur les indicateurs et instructions publiés par Tencent.

FAQ

Q : Qu’est-ce que Tencent HY 2.0 ?

R : Il s’agit de la dernière génération du grand modèle de langage polyvalent de Tencent Hunyuan, utilisant l’architecture MoE, avec des paramètres totaux de 406B et une activation de 32B, axée sur le raisonnement, le code et les capacités de texte long.

Q : Quelles sont les versions spécifiques de cette sortie ?

R : Il existe deux principaux types de modèles textuels : Tencent HY 2.0 Think (pour le raisonnement profond) et Tencent HY 2.0 Instruct (pour le dialogue général et la rédaction).

Q : Quelles sont les spécifications contextuelles et entrée/sortie de HY 2.0 ?

R : Le modèle familial affirme supporter jusqu’à 256K contexte, et l’entrée maximale actuelle de l’interface cloud Think/Instruct est de 128K, dont la sortie maximale de Think est de 64K et la sortie maximale d’Instruct de 16K.

Q : Quelle est la principale différence entre Think et Instruction ?

R : Think est plus adapté aux tâches de « pensée lente » telles que le raisonnement complexe, la génération de code et les appels d’outils d’agent. Instruct est mieux adapté aux scénarios de chat, d’écriture et de questions-réponses professionnels, avec une forte concurrence et des besoins de réponse élevés.

Q : Est-ce entièrement open source, comment y accéder et l’utiliser ?

R : HY 2.0 propose actuellement des services commerciaux sous forme d’API Tencent Cloud, et a été intégré à certains produits Tencent.

Modèle de langage grand Tencent Hunyuan HY2.0 Architecture experte hybride Tencent HY2 point 0MoE Tencent HY2 point 0 supporte 256K long contexte Tencent HY2 points 0 capacité de raisonnement mathématique a été améliorée Quelle est l’efficacité de la génération de code Tencent HY2 point 0 ? Tencent HY2 points 0 performance d’exécution de tâches complexes Tencent HY2 points 0 IMOAnswerBench score Performances de Tencent HY2.0 dans le benchmark SWEbench TencentHY2 points 0 dans l’agent Tau2Bench Tencent HY2 point 0Pensez à une version de raisonnement approfondi Tencent HY2 point 0 Instruire la version générale du dialogue Pour quels scénarios d’utilisation HY2 point 0Think convient-il ? HY2 point 0 Instruct convient aux services à forte concurrence HY2 point 0 fenêtre de contexte la plus longue 256K introduction Spécifications d’entrée et de sortie de l’interface cloud HY2 point 0 HY2 point 0, paramètres totaux 406 milliards, activé 32 milliards Comment améliorer l’écriture longue avec HY2 points 0 Hunyuan HY2 points 0 évaluation de l’expérience de dialogue en plusieurs tours Application de HY2 point 0 dans le développement assisté par le code HY2 virgule 0 performance dans les appels d’outils d’agent HY2.0 utilisait RLVR plus RLHF pour l’apprentissage par renforcement HY2 point 0 Comment équilibrer profondeur de pensée et efficacité HY2 point 0 mission bac à sable et conception de pénalité de longueur Tencent Yuanbao a été relié au modèle Hunyuan HY2.0 Processus d’accès à l’appel API Tencent Cloud HY2.0 Comment les entreprises peuvent construire des assistants industriels basés sur le HY2 point 0 L’application de HY2 point 0 dans les Q&R de la base de connaissances de l’entreprise Cas d’atterrissage HY2 virgule 0 dans le scénario du robot de service client Le HY2 point 0 soutient-il la revue de conformité légale des documents longs ? HY2 points 0 avantages dans les scénarios de conseil en éducation et apprentissage HY2 point 0 en capacités d’analyse de données et de génération de rapports Comparaison des performances HY2.0 avec la génération précédente de modèle hybride HY2 points 0 évaluation horizontale avec d’autres grands modèles grand public HY2 points 0 support multilingue et capacités de localisation HY2 points 0 dans la planification de jeux et les applications de création d’intrigues HY2 points 0 à la valeur écologique des mini-programmes et du WeChat d’entreprise HY2 point 0 Performance dans la génération de copies audio et vidéo HY2 point 0 convient aux développeurs individuels Prix d’appel HY2:0 et référence sur la méthode de facturation La politique actuelle de restriction HY2.0 touche les grandes entreprises HY2 point 0 : Quels quotas doit-on surveiller lors de l’accès à l’API ? HY2 point 0 convient à la création d’un assistant de connaissances intelligent personnel Schéma de plug-in HY2 point 0 dans les applications basées sur des outils Le point 0 HY2 est combiné avec une base de données vectorielle pour l’amélioration de la récupération HY2 point 0 est la valeur des processus automatisés au sein de l’entreprise Points HY2 0 Aider les entreprises à améliorer leurs systèmes de recherche et de recommandation Potentiel HY2.0 dans les scénarios gouvernementaux et de la fonction publique HY2 points 0 dans l’application de l’analyse textuelle de conformité du contrôle des risques financiers HY2 point 0 ouvrira le téléchargement de poids du modèle à l’avenir Itinéraire de développement écologique HY2.0 et attention aux ressources communautaires

Outils Recommandés

Plus