Retour à L’IA est open source
Tencent Hunyuan Tencent-HY-MT1.5 Open Source : 1,8 milliards de traduction côté end-side et 7B d’interprétation collaborative cloud

Tencent Hunyuan Tencent-HY-MT1.5 Open Source : 1,8 milliards de traduction côté end-side et 7B d’interprétation collaborative cloud

L’IA est open source Admin 267 vues

1. Résumé

Tencent-HY-MT1.5 (HY-MT) est la suite de modèles de traduction automatique open source de Tencent, qui comprend deux échelles : 1,8B (côté partiel/ressources limitées) et 7B (cloud partiel/haute qualité). L’officiel met l’accent sur son déploiement collaboratif pour le « côté appareil + côté cloud » : faible latence et faible utilisation de la mémoire sur l’appareil, meilleure qualité et performances de scènes complexes plus robustes sur le cloud, et couvrant 33+ langues/dialectes (y compris certains dialectes min-chinois et chinois) des capacités de traduction mutuelle.

2. Caractéristiques principales

1. Couverture double modèle du cloud final : 1.8B s’adapte au matériel grand public et à la traduction hors ligne/temps réel ; Le 7B est une version de meilleure qualité et convient aux scénarios cloud batch et à forte demande.

2. Rapidité et convivialité : 1.8B propose une version quantifiée, avec une consommation officielle d’environ 1 Go de mémoire et des données à faible latence de 50 jetons (selon votre matériel et votre cadre d’inférence).

3. Capacités d’amélioration de la production : Soutenir nativement l’intervention des termes (comparaison personnalisée des termes), la traduction contextuelle des longues conversations et la traduction de texte formaté (conserver les étiquettes/la typographie autant que possible).

4. Couverture multilingue : En plus du chinois, anglais, japonais, etc. courants, il couvre également une variété de langues mineures ; Il convient au commerce électronique transfrontalier, à l’internationalisation des contenus et au service client multilingue.

3. Installation

  1. Préparation de l’environnement : Il est recommandé de donner la priorité à l’utilisation de la version officiellement recommandée de Transformers (l’exemple du dépôt est un numéro de version fixe) et de préparer l’environnement d’inférence GPU/CPU.
  2. Obtenir le modèle : Télécharger les poids correspondants (1.8B/7B, FP8, GPTQ Int4, etc.) depuis Hugging Face.
  3. Méthode d’inférence : Construire un modèle d’invite de traduction selon l’exemple de la carte/entrepôt modèle (différents modèles de traduction pour les traductions chinoises et étrangères, les traductions étrangères, et les modèles de traduction terme/contexte/format sont différents), puis appelez l’interface de génération pour produire la traduction.

4. Cas d’usage typiques

  1. Traduction hors ligne côté appareil : scénarios à faible latence tels que mobile, bureau, plug-ins navigateur, et traduction de méthode d’entrée/trait.
  2. Traduction de haute qualité dans le cloud : traduction par lots de documents, production internationale de contenu, et construction de bases de connaissances multilingues.
  3. Cohérence dans la terminologie industrielle : les documents médicaux, juridiques, financiers, d’ingénierie logicielle, etc., nécessitent un texte « pas de dérive terminologique ».
  4. Dialogues à plusieurs rounds et service client : Utilisez le dialogue historique comme contexte pour réduire les erreurs de référence des pronoms et les ruptures de style.
  5. Texte de page web/balise : traduction HTML/texte tagué, essayez de maintenir la structure originale pour faciliter le rellenage et le rendu.

5. Écologie et produits concurrents

  1. Écosystème : Fournir des exemples d’ingénierie GitHub et des rapports techniques ; Hugging Face propose une variété de versions de précision/quantification pour faciliter le choix des différents coûts d’inférence côté appareil et dans le cloud.
  2. Référence de produit concurrentielle : le côté open source peut être comparé à MarianMT, la série NLLB, M2M100, SeamlessM4T, etc. ; Le côté propriétaire est couramment utilisé pour traduire les capacités de traduction de diverses API de traduction ou de grands modèles à usage général. Les recommandations de sélection réelles sont testées A/B en fonction de votre couverture linguistique, de la rétention du format, de la cohérence terminologique et des métriques de débit/latence.

6. Limitations et précautions

  1. Transférabilité de l’indicateur : Les données officielles de vitesse/mémoire et les classements des effets reposent généralement sur des configurations matérielles spécifiques, de quantification et d’inférence, et doivent être testés à nouveau sur le dispositif cible avant le lancement.
  2. Dépendance aux prompts : La traduction des termes/contextes/formats doit organiser l’entrée strictement selon le modèle, sinon il peut y avoir des sorties explicatives ou des changements de format.
  3. Petites langues et styles familiers : Les langues à longue traîne, l’argot et les textes de terrain forts peuvent encore être mal traduits ou omis, il est donc recommandé d’introduire un glossaire et un échantillonnage manuel pour boucler la boucle.
  4. Cohérence entre l’appareil et le cloud : Si le côté appareil et le côté cloud utilisent des versions ou une précision de quantification différentes, le style de sortie peut ne pas être totalement cohérent, et il doit être convergé via des mots d’ennui et des stratégies terminologiques.

7. Adresse du projet

https://github.com/Tencent-Hunyuan/HY-MT

8. Questions fréquemment posées

Q : Quels scénarios de « traduction du côté terminal » HY-MT1.5-1.8B convient-ils ?

R : Il convient aux applications sensibles à la latence, disposant de ressources limitées sur l’appareil et nécessitant une disponibilité hors ligne, telles que la traduction mobile, la traduction IM embarquée, la traduction par coups de navigateur, etc.

Q : Comment choisir entre HY-MT1.5-7B et 1.8B ? Faut-il vraiment choisir l’un ou l’autre ?

A : priorité côté appareil 1.8B, priorité cloud 7B ; Vous pouvez également générer des résultats côté appareil et les revoir/retraduire dans le cloud pour obtenir une qualité et une cohérence plus stables.

Q : Comment fonctionne l'« Intervention sur la base de termes/terminologie » de HY-MT1.5 ?

R : Selon le modèle officiel de la consigne terminologique, la comparaison entre « terme source → terme cible » est injectée comme contrainte, puis le texte principal est traduit pour améliorer la cohérence de la terminologie.

Q : Comment HY-MT1.5 fait-il la traduction de contexte des longues conversations ?

R : Utilisez le dialogue historique comme entrée de bloc de contexte et utilisez le modèle de traduction de contexte pour permettre au modèle de se référer au contexte avant de traduire la phrase en cours.

Q : Quels textes HY-MT1.5 utilise-t-il pour des traductions préservant le format ?

R : Adapté au texte contenant des tags ou des tags (par exemple, extraits de pages web ou fragments structurés). Il est recommandé d’utiliser de petits échantillons pour vérifier que les marques sont stables et conservées, puis d’étendre au procédé par lots.

Guide de traduction Tencent Hunyuan HY-MT1.5 Dual-Model Device-Cloud Exercice de déploiement de l’appareil Tencent-HY-MT1.5 Tencent HY-MT1.5 Cloud 7B solution de traduction de haute qualité HY-MT1.5 couvre 33+ capacités de traduction linguistique Tencent Open Source Terminologie HY-MT Utilisation des interventions HY-MT1.5 Compétences de traduction du contexte des longues conversations Tutoriel de traduction de la rétention du format Tencent HY-MT1.5 Évaluation quantitative de la mémoire et de la latence des versions HY-MT1.5 Conception d’architecture collaborative de traduction device-cloud HY-MT1.5 L’ensemble du processus d’installation et d’inférence de Tencent-HY-MT1.5 Modèle d’invite HY-MT1.5 et optimisation des effets de traduction Tencent HY-MT1.5 est une application de traduction hors ligne côté appareil Traduction de documents cloud batch HY-MT1.5 implémentée HY-MT1.5 Solution multilingue de traduction de conversations pour le service client Pratique multilingue de commerce électronique transfrontalier Tencent HY-MT1.5 HY-MT1.5 Terminologie : cohérence dans les applications de traduction médicale HY-MT1.5 Terminologie financière juridique sans dérive Meilleures pratiques pour la traduction de documents en ingénierie logicielle HY-MT1.5 Traduction et remplissage HTML des pages web HY-MT1.5 Configuration d’inférence de dispositif à faible ressource côté extrémité HY-MT1.5 Analyse comparative des modèles HY-MT1.5 et MarianMT Différences et choix entre les séries HY-MT1.5 et NLLB HY-MT1.5 comparé à l’évaluation de la qualité de traduction du M2M100 Capacités HY-MT1.5 vs. SeamlessM4T Problèmes et solutions de cohérence entre appareil et cloud HY-MT1.5 HY-MT1.5 Notes sur la langue mineure et la traduction du corps familier Liste des indicateurs de test A/B avant le lancement de HY-MT1.5 HY-MT1.5 traduit d’abord la solution de revue cloud Exemple de carte modèle HY-MT1.5 et exemple d’ingénierie Guide de téléchargement du poids du visage élangé HY-MT1.5 Sélection quantitative HY-MT1.5 FP8 et GPTQ Int4 Sélection du cadre d’inférence HY-MT1.5 et réglage des performances Interprétation du benchmark 50tokens à faible latence HY-MT1.5 HY-MT1.5 occupe environ 1 Go de mémoire et le chemin d’implémentation Processus de construction de bases de connaissances multilingues HY-MT1.5 Conception internationale de la chaîne de production de contenu HY-MT1.5 Solution de traduction de la fin de la méthode d’entrée HY-MT1.5 Implémentation de traduction hors ligne du plug-in navigateur HY-MT1.5 Guide d’atterrissage en temps réel IM intégré HY-MT1.5 Traduction du format HY-MT1.5 pour éviter les embouts de décalage d’étiquette Pratique de construction et d’injection du glossaire HY-MT1.5 HY-MT1.5 Organisation des blocs contextuels et homonymie des pronoms HY-MT1.5 Méthode d’amélioration robuste pour des scénarios complexes Différents styles de précision convergent dans le cloud d’appareils HY-MT1.5 Surveillance de l’environnement de production HY-MT1.5 et inspection d’échantillonnage manuel HY-MT1.5 Stratégies pour gérer les mauvaises traductions et omissions linguistiques à longue traîne Adresse du projet Tencent HY-MT1.5 et ressources écologiques HY-MT1.5 est entièrement analysé depuis l’installation jusqu’aux cas d’usage typiques

Outils Recommandés

Plus