Tencent Hunyuan Tencent-HY-MT1.5 Open Source : 1,8 milliards de traduction côté end-side et 7B d’interprétation collaborative cloud

1. Résumé

Tencent-HY-MT1.5 (HY-MT) est la suite de modèles de traduction automatique open source de Tencent, qui comprend deux échelles : 1,8B (côté partiel/ressources limitées) et 7B (cloud partiel/haute qualité). L’officiel met l’accent sur son déploiement collaboratif pour le « côté appareil + côté cloud » : faible latence et faible utilisation de la mémoire sur l’appareil, meilleure qualité et performances de scènes complexes plus robustes sur le cloud, et couvrant 33+ langues/dialectes (y compris certains dialectes min-chinois et chinois) des capacités de traduction mutuelle.

2. Caractéristiques principales

1. Couverture double modèle du cloud final : 1.8B s’adapte au matériel grand public et à la traduction hors ligne/temps réel ; Le 7B est une version de meilleure qualité et convient aux scénarios cloud batch et à forte demande.

2. Rapidité et convivialité : 1.8B propose une version quantifiée, avec une consommation officielle d’environ 1 Go de mémoire et des données à faible latence de 50 jetons (selon votre matériel et votre cadre d’inférence).

3. Capacités d’amélioration de la production : Soutenir nativement l’intervention des termes (comparaison personnalisée des termes), la traduction contextuelle des longues conversations et la traduction de texte formaté (conserver les étiquettes/la typographie autant que possible).

4. Couverture multilingue : En plus du chinois, anglais, japonais, etc. courants, il couvre également une variété de langues mineures ; Il convient au commerce électronique transfrontalier, à l’internationalisation des contenus et au service client multilingue.

3. Installation

Préparation de l’environnement : Il est recommandé de donner la priorité à l’utilisation de la version officiellement recommandée de Transformers (l’exemple du dépôt est un numéro de version fixe) et de préparer l’environnement d’inférence GPU/CPU.
Obtenir le modèle : Télécharger les poids correspondants (1.8B/7B, FP8, GPTQ Int4, etc.) depuis Hugging Face.
Méthode d’inférence : Construire un modèle d’invite de traduction selon l’exemple de la carte/entrepôt modèle (différents modèles de traduction pour les traductions chinoises et étrangères, les traductions étrangères, et les modèles de traduction terme/contexte/format sont différents), puis appelez l’interface de génération pour produire la traduction.

4. Cas d’usage typiques

Traduction hors ligne côté appareil : scénarios à faible latence tels que mobile, bureau, plug-ins navigateur, et traduction de méthode d’entrée/trait.
Traduction de haute qualité dans le cloud : traduction par lots de documents, production internationale de contenu, et construction de bases de connaissances multilingues.
Cohérence dans la terminologie industrielle : les documents médicaux, juridiques, financiers, d’ingénierie logicielle, etc., nécessitent un texte « pas de dérive terminologique ».
Dialogues à plusieurs rounds et service client : Utilisez le dialogue historique comme contexte pour réduire les erreurs de référence des pronoms et les ruptures de style.
Texte de page web/balise : traduction HTML/texte tagué, essayez de maintenir la structure originale pour faciliter le rellenage et le rendu.

5. Écologie et produits concurrents

Écosystème : Fournir des exemples d’ingénierie GitHub et des rapports techniques ; Hugging Face propose une variété de versions de précision/quantification pour faciliter le choix des différents coûts d’inférence côté appareil et dans le cloud.
Référence de produit concurrentielle : le côté open source peut être comparé à MarianMT, la série NLLB, M2M100, SeamlessM4T, etc. ; Le côté propriétaire est couramment utilisé pour traduire les capacités de traduction de diverses API de traduction ou de grands modèles à usage général. Les recommandations de sélection réelles sont testées A/B en fonction de votre couverture linguistique, de la rétention du format, de la cohérence terminologique et des métriques de débit/latence.

6. Limitations et précautions

Transférabilité de l’indicateur : Les données officielles de vitesse/mémoire et les classements des effets reposent généralement sur des configurations matérielles spécifiques, de quantification et d’inférence, et doivent être testés à nouveau sur le dispositif cible avant le lancement.
Dépendance aux prompts : La traduction des termes/contextes/formats doit organiser l’entrée strictement selon le modèle, sinon il peut y avoir des sorties explicatives ou des changements de format.
Petites langues et styles familiers : Les langues à longue traîne, l’argot et les textes de terrain forts peuvent encore être mal traduits ou omis, il est donc recommandé d’introduire un glossaire et un échantillonnage manuel pour boucler la boucle.
Cohérence entre l’appareil et le cloud : Si le côté appareil et le côté cloud utilisent des versions ou une précision de quantification différentes, le style de sortie peut ne pas être totalement cohérent, et il doit être convergé via des mots d’ennui et des stratégies terminologiques.

7. Adresse du projet

https://github.com/Tencent-Hunyuan/HY-MT

8. Questions fréquemment posées

Q : Quels scénarios de « traduction du côté terminal » HY-MT1.5-1.8B convient-ils ?

R : Il convient aux applications sensibles à la latence, disposant de ressources limitées sur l’appareil et nécessitant une disponibilité hors ligne, telles que la traduction mobile, la traduction IM embarquée, la traduction par coups de navigateur, etc.

Q : Comment choisir entre HY-MT1.5-7B et 1.8B ? Faut-il vraiment choisir l’un ou l’autre ?

A : priorité côté appareil 1.8B, priorité cloud 7B ; Vous pouvez également générer des résultats côté appareil et les revoir/retraduire dans le cloud pour obtenir une qualité et une cohérence plus stables.

Q : Comment fonctionne l'« Intervention sur la base de termes/terminologie » de HY-MT1.5 ?

R : Selon le modèle officiel de la consigne terminologique, la comparaison entre « terme source → terme cible » est injectée comme contrainte, puis le texte principal est traduit pour améliorer la cohérence de la terminologie.

Q : Comment HY-MT1.5 fait-il la traduction de contexte des longues conversations ?

R : Utilisez le dialogue historique comme entrée de bloc de contexte et utilisez le modèle de traduction de contexte pour permettre au modèle de se référer au contexte avant de traduire la phrase en cours.

Q : Quels textes HY-MT1.5 utilise-t-il pour des traductions préservant le format ?

R : Adapté au texte contenant des tags ou des tags (par exemple, extraits de pages web ou fragments structurés). Il est recommandé d’utiliser de petits échantillons pour vérifier que les marques sont stables et conservées, puis d’étendre au procédé par lots.

Articles connexes

L’introduction en bourse Zhipu Hong Kong lance l’introduction en bourse : code 2513, qui doit être inscrite sur le siège de la Bourse de Hong Kong le 8 janvier 2026

Analyse open source de HY-Motion 1.0 : Guide pour démarrer avec le modèle d’action DiT Wensheng de Tencent à 1 milliard de paramètres de Hunyuan

Mem0 vaut-il la peine d’être intégré à un agent ? La mémoire à long terme est utile, mais il faut gérer les limites

Quel type d’équipe Haystack convient-il ? C’est plutôt comme un framework d’ingénierie RAG composable

Outils Recommandés