1. Résumé
Hy-MT1.5-1.8B-1.25bit est un modèle de traduction hors ligne à faible bit basé sur HY-MT1.5-1.8B lancé par l’équipe hybride de Tencent, avec une taille de paramètre de 1,8 B et un volume quantifié d’environ 440 Mo. Il est déployé pour les appareils mobiles et périphériques, prenant en charge 33 langues, 5 dialectes/langues minoritaires, et 1056 instructions de traduction. Selon le rapport technique officiel, le modèle présente une forte efficacité des paramètres dans les tâches de traduction chinois standard, étranger et anglais-étranger, et peut rivaliser avec certaines API de traduction commerciales et des modèles open source à plus grande échelle. Il est toujours recommandé de revoir l’effet spécifique selon le langage métier et l’ensemble de tests.
2. Caractéristiques principales
- Volume extrêmement faible : compressez le modèle FP16 d’environ 3,3 Go à environ 440 Mo via une quantification ternaire Sherry 1,25 bit.
- Hors ligne mobile : L’APK officiel de démo Android est fourni pour bénéficier d’une traduction hors ligne dans un environnement sans réseau.
- Couverture multilingue : Soutenir le chinois, l’anglais, le japonais, le coréen, le français, l’espagnol, le tibétain, le mongol, l’ouïghour, le cantonais, etc.
- Amélioration des capacités de traduction : Soutenir des tâches telles que l’intervention terminologique, la traduction contextuelle et la maintenance du format.
- Prise en charge du cadre de compression : S’appuyant sur la chaîne d’outils AngelSlim, il couvre la quantification, le déploiement et les itérations ultérieures d’algorithmes de compression.
3. Installation
- Expérience Android : Téléchargez l’APK officiel de la Démo et faites l’expérience de la traduction hors ligne directement après l’installation.
- Poids des modèles : Téléchargez les poids 1,25 bits ou la version GGUF de Hugging Face.
- Chaîne d’outils AngelSlim : peut être installée par pip install angelslim ; La méthode du code source peut être clonée depuis GitHub puis exécuter Python setup.py installation.
- Note : La documentation officielle montre que le noyau STQ lié à llama.cpp est encore en cours, et que le déploiement du projet doit être soumis à la description la plus récente du dépôt.
4. Cas d’usage typiques
- Traduction mobile hors ligne : adaptée aux voyages, aux communications transfrontalières, aux scénarios réseau faible ou inexistants.
- Traduction de texte sensible à la confidentialité : Le texte peut être traité localement, réduisant ainsi le besoin de télécharger des services externes.
- Traduction mutuelle des langues mineures : couvrant le tibétain, le mongol, l’ouïghoure et d’autres langues issues des minorités ethniques.
- Traduction de la terminologie d’entreprise : Elle peut être combinée avec des modèles d’intervention terminologique pour améliorer la cohérence du vocabulaire professionnel.
- Sélection de mots inter-applications : La démo Android démontre le mode de sélection de mots en arrière-plan, adapté à la traduction d’emails, de pages web et de contenus de discussion.
5. Écologie et produits concurrents
- Écosystème : Le projet propose également des poids de face Hugging, la version GGUF, une démo Android, la documentation AngelSlim et des dépôts GitHub.
- Produits concurrents : Il peut être comparé à des services commerciaux tels que Google Translate, Microsoft Translator, DeepL et Doubao Translation, ainsi qu’à Tower-Plus, Qwen et d’autres modèles de MT open source.
- Différences : Les principaux avantages de Hy-MT1.5-1.8B-1.25bit sont sa petite taille, son accessibilité hors ligne et sa large couverture linguistique, ce qui le rend adapté à la traduction en fin de route plutôt qu’aux API cloud.
6. Limitations et précautions
- Le benchmark officiel n’est pas le même que pour tous les scénarios commerciaux réels et doit être testé à nouveau selon la direction, le champ et la longueur du texte.
- La quantification en bas bit peut produire des résultats instables dans des phrases longues complexes, des termes techniques ou un langage à faible ressource.
- L’APK Android est adapté à l’expérience, et le déploiement en production doit toujours prêter attention aux permissions, aux mécanismes de mise à jour et aux audits de sécurité.
- GGUF et l’écosystème du noyau côté end-side sont encore en itération, et le support actuel du backend d’inférence devrait être confirmé avant le déploiement.
- Lorsqu’il s’agit de textes à haut risque tels que le droit, les soins médicaux et les contrats, il est recommandé de consulter les manuels.
7. Adresse du projet
https://github.com/tencent/AngelSlim
8. Questions fréquemment posées
Q : Peut-on traduire complètement Hy-MT1.5-1.8B-1.25bit hors ligne ?
R : La démo officielle d’Android est destinée à une expérience de traduction hors ligne, et le modèle peut être exécuté localement après téléchargement ; Pour le déploiement réel, veuillez consulter la documentation la plus récente.
Q : Quels langages prend en charge Hy-MT1.5-1.8B-1.25bit ?
R : Il existe 33 langues officielles et 5 types de dialectes/langues minoritaires, dont le chinois, l’anglais, le japonais, le coréen, le tibétain, le mongol, l’ouïghour, le cantonais, etc.
Q : Lequel est meilleur, Hy-MT1.5-1.8B-1.25bit ou Google Traduction ?
R : Le rapport officiel met en avant sa forte compétitivité sur plusieurs benchmarks standards ; Cependant, Google Traduction est un service commercial continuellement mis à jour, et il est recommandé de le tester selon les instructions spécifiques de la langue et le texte de domaine.
Q : La quantification 1,25 bit perd-elle de la qualité de traduction ?
R : Officiellement, Sherry quantifie la performance quasi-sans perte tout en compressant le volume ; L’effet réel dépend toujours de la direction du langage et du contenu d’entrée.