一、摘要
Hy-MT1.5-1.8B-1.25bit 是腾讯混元团队基于 HY-MT1.5-1.8B 推出的低比特离线翻译模型,模型参数规模为 1.8B,量化后体积约 440MB。它面向手机端和边缘设备部署,支持 33 种语言、5 类方言/少数民族语言,以及 1056 个翻译方向。官方技术报告称,该模型在标准中外、英外翻译任务上具备较强参数效率,并可与部分商业翻译 API 和更大规模开源模型竞争;具体效果仍建议按业务语向和测试集复核。
二、核心特性
1、极低体积:通过 Sherry 1.25-bit 三值量化,将 FP16 约 3.3GB 模型压缩到约 440MB。
2、手机端离线:官方提供 Android Demo APK,可在无网络环境下体验离线翻译。
3、多语言覆盖:支持中文、英文、日文、韩文、法文、西班牙文、藏语、蒙古语、维吾尔语、粤语等。
4、翻译能力增强:支持术语干预、上下文翻译和格式保持等任务。
5、压缩框架支撑:依托 AngelSlim 工具链,覆盖量化、部署与后续压缩算法迭代。
三、安装
1、Android 体验:下载官方 Demo APK,安装后可直接体验离线翻译。
2、模型权重:从 Hugging Face 下载 1.25-bit 权重或 GGUF 版本。
3、AngelSlim 工具链:可通过 pip install angelslim 安装;源码方式可克隆 GitHub 后运行 python setup.py install。
4、注意:官方文档显示 llama.cpp 相关 STQ kernel 仍在推进中,工程部署需以最新仓库说明为准。
四、典型用例
1、手机离线翻译:适合旅行、跨境沟通、弱网或无网场景。
2、隐私敏感文本翻译:文本可在本地处理,减少上传外部服务的需求。
3、小语种互译:覆盖藏语、蒙古语、维吾尔语等少数民族语言方向。
4、企业术语翻译:可结合术语干预模板,提升专业词汇一致性。
5、跨应用取词:Android Demo 展示了后台取词模式,适合邮件、网页和聊天内容翻译。
五、生态与竞品
1、生态:项目同时提供 Hugging Face 权重、GGUF 版本、Android Demo、AngelSlim 文档和 GitHub 仓库。
2、竞品:可与 Google Translate、Microsoft Translator、DeepL、豆包翻译等商业服务,以及 Tower-Plus、Qwen、其他开源 MT 模型对比。
3、差异点:Hy-MT1.5-1.8B-1.25bit 的核心优势在于体积小、可离线、语言覆盖较广,适合端侧翻译而非只面向云端 API。
六、局限与注意事项
1、官方基准不等同于所有真实业务场景,需按语向、领域和文本长度复测。
2、低比特量化可能在复杂长句、专业术语或低资源语言上出现不稳定结果。
3、Android APK 适合体验,生产部署仍需关注权限、更新机制和安全审计。
4、GGUF 与端侧 kernel 生态仍在迭代,部署前应确认当前推理后端支持情况。
5、涉及法律、医疗、合同等高风险文本时,建议人工复核。
七、项目地址
https://github.com/tencent/AngelSlim
八、常见问题
Q: Hy-MT1.5-1.8B-1.25bit 是否可以完全离线翻译?
A: 官方 Android Demo 面向离线翻译体验,模型下载后可在本地运行;实际部署方式需参考最新文档。
Q: Hy-MT1.5-1.8B-1.25bit 支持哪些语言?
A: 官方列出 33 种语言和 5 类方言/少数民族语言,包括中文、英文、日文、韩文、藏语、蒙古语、维吾尔语、粤语等。
Q: Hy-MT1.5-1.8B-1.25bit 和 Google Translate 谁更好?
A: 官方报告强调其在若干标准基准上具备强竞争力;但 Google Translate 属于持续更新的商业服务,建议按具体语向和领域文本实测。
Q: 1.25-bit 量化会损失翻译质量吗?
A: 官方称 Sherry 量化在压缩体积的同时保持接近无损表现;实际效果仍取决于语言方向和输入内容。