腾讯Hy-MT1.5-1.8B-1.25bit 开源：440MB 手机离线翻译模型解析

Ai开源 • Admin • 2026/4/30 • 240 次浏览

一、摘要

Hy-MT1.5-1.8B-1.25bit 是腾讯混元团队基于 HY-MT1.5-1.8B 推出的低比特离线翻译模型，模型参数规模为 1.8B，量化后体积约 440MB。它面向手机端和边缘设备部署，支持 33 种语言、5 类方言/少数民族语言，以及 1056 个翻译方向。官方技术报告称，该模型在标准中外、英外翻译任务上具备较强参数效率，并可与部分商业翻译 API 和更大规模开源模型竞争；具体效果仍建议按业务语向和测试集复核。

二、核心特性

1、极低体积：通过 Sherry 1.25-bit 三值量化，将 FP16 约 3.3GB 模型压缩到约 440MB。

2、手机端离线：官方提供 Android Demo APK，可在无网络环境下体验离线翻译。

3、多语言覆盖：支持中文、英文、日文、韩文、法文、西班牙文、藏语、蒙古语、维吾尔语、粤语等。

4、翻译能力增强：支持术语干预、上下文翻译和格式保持等任务。

5、压缩框架支撑：依托 AngelSlim 工具链，覆盖量化、部署与后续压缩算法迭代。

三、安装

1、Android 体验：下载官方 Demo APK，安装后可直接体验离线翻译。

2、模型权重：从 Hugging Face 下载 1.25-bit 权重或 GGUF 版本。

3、AngelSlim 工具链：可通过 pip install angelslim 安装；源码方式可克隆 GitHub 后运行 python setup.py install。

4、注意：官方文档显示 llama.cpp 相关 STQ kernel 仍在推进中，工程部署需以最新仓库说明为准。

四、典型用例

1、手机离线翻译：适合旅行、跨境沟通、弱网或无网场景。

2、隐私敏感文本翻译：文本可在本地处理，减少上传外部服务的需求。

3、小语种互译：覆盖藏语、蒙古语、维吾尔语等少数民族语言方向。

4、企业术语翻译：可结合术语干预模板，提升专业词汇一致性。

5、跨应用取词：Android Demo 展示了后台取词模式，适合邮件、网页和聊天内容翻译。

五、生态与竞品

1、生态：项目同时提供 Hugging Face 权重、GGUF 版本、Android Demo、AngelSlim 文档和 GitHub 仓库。

2、竞品：可与 Google Translate、Microsoft Translator、DeepL、豆包翻译等商业服务，以及 Tower-Plus、Qwen、其他开源 MT 模型对比。

3、差异点：Hy-MT1.5-1.8B-1.25bit 的核心优势在于体积小、可离线、语言覆盖较广，适合端侧翻译而非只面向云端 API。

六、局限与注意事项

1、官方基准不等同于所有真实业务场景，需按语向、领域和文本长度复测。

2、低比特量化可能在复杂长句、专业术语或低资源语言上出现不稳定结果。

3、Android APK 适合体验，生产部署仍需关注权限、更新机制和安全审计。

4、GGUF 与端侧 kernel 生态仍在迭代，部署前应确认当前推理后端支持情况。

5、涉及法律、医疗、合同等高风险文本时，建议人工复核。

七、项目地址

https://github.com/tencent/AngelSlim

八、常见问题

Q: Hy-MT1.5-1.8B-1.25bit 是否可以完全离线翻译？

A: 官方 Android Demo 面向离线翻译体验，模型下载后可在本地运行；实际部署方式需参考最新文档。

Q: Hy-MT1.5-1.8B-1.25bit 支持哪些语言？

A: 官方列出 33 种语言和 5 类方言/少数民族语言，包括中文、英文、日文、韩文、藏语、蒙古语、维吾尔语、粤语等。

Q: Hy-MT1.5-1.8B-1.25bit 和 Google Translate 谁更好？

A: 官方报告强调其在若干标准基准上具备强竞争力；但 Google Translate 属于持续更新的商业服务，建议按具体语向和领域文本实测。

Q: 1.25-bit 量化会损失翻译质量吗？

A: 官方称 Sherry 量化在压缩体积的同时保持接近无损表现；实际效果仍取决于语言方向和输入内容。

腾讯Hy-MT1.5-1.8B-1.25bit 开源：440MB 手机离线翻译模型解析

相关文章

AI每日动态：数字中国热度升温，Google与微软继续加码AI

Hermes Agent SMS 怎么配置？

Mem0 值得接入 Agent 吗？长期记忆有用但要管好边界

Haystack 适合什么团队？它更像可组合的 RAG 工程框架

推荐工具

腾讯Hy-MT1.5-1.8B-1.25bit 开源：440MB 手机离线翻译模型解析

相关文章

AI每日动态：数字中国热度升温，Google与微软继续加码AI

Hermes Agent SMS 怎么配置？

Mem0 值得接入 Agent 吗？长期记忆有用但要管好边界

Haystack 适合什么团队？它更像可组合的 RAG 工程框架

推荐工具

提交AI工具

请确认提交信息