텐센트 훈위안 텐센트-HY-MT1.5 오픈 소스: 18억 엔드 사이드 번역과 7억 클라우드 협업 실용 해석

1. 초록

텐센트-HY-MT1.5(HY-MT)는 텐센트의 오픈 소스 기계 번역 모델 제품군으로, 1.8B(부분 측면/저자원)와 7B(부분 클라우드/고품질) 두 가지 규모를 포함합니다. 관계자는 "장치 측 + 클라우드 측"에 대한 협력적 배포를 강조합니다: 기기 내 낮은 지연과 낮은 메모리 사용량, 클라우드에서의 더 강력한 품질과 더 견고한 복잡한 장면 성능, 그리고 33+ 언어/방언(일부 민한어 및 중국어 방언 포함) 상호 번역 기능을 포함합니다.

2. 핵심 특징

1. 엔드 클라우드의 듀얼 모델 커버리지: 1.8B는 소비자용 하드웨어와 오프라인/실시간 변환에 적응함; 7B는 더 높은 품질의 버전이며 클라우드 배치 및 수요가 많은 시나리오에 적합합니다.

2. 속도 및 자원 친화적: 1.8B는 양자화된 버전을 제공하며, 공식 용량은 약 1GB의 메모리 사용량과 하드웨어 및 추론 프레임워크에 따라 50개의 토큰의 저지연 데이터를 제공합니다.

3. 생산 향상 기능: 네이티브로 용어 개입(사용자 지정 용어 비교), 긴 대화 문맥 번역, 서식화된 텍스트 번역(가능한 한 라벨/타이포그래피 유지)을 지원합니다.

4. 다국어 방송: 중국어, 영어, 일본어 등 일반적인 언어 외에도 다양한 소규모 언어도 포함합니다; 국경 간 전자상거래, 콘텐츠 국제화, 다국어 고객 서비스에 적합합니다.

3. 설치

환경 준비: 공식 권장 Transformers 버전(저장소 예제는 고정된 버전 번호)을 우선적으로 사용하고 GPU/CPU 추론 환경을 준비하는 것이 권장됩니다.
모델 획득: Hugging Face에서 해당 가중치(1.8B/7B, FP8, GPTQ Int4 등)를 다운로드하세요.
추론 방법: 모델 카드/창고 예제에 따라 번역 프롬프트 템플릿을 구축합니다(중국어와 외국 번역, 외국 번역, 용어/문맥/형식 번역 템플릿은 다릅니다). 그리고 생성 인터페이스를 호출하여 번역을 출력합니다.

4. 일반적인 사용 사례

기기 측의 오프라인 번역: 모바일, 데스크톱, 브라우저 플러그인, 입력법/획 번역과 같은 저지연 시나리오.
클라우드 내 고품질 번역: 문서 일괄 번역, 국제 콘텐츠 제작, 다국어 지식 기반 구축.
산업 용어의 일관성: 의료, 법률, 재무, 소프트웨어 공학 문서 등은 "용어 편차가 없는" 문구를 요구합니다.
다중 대화 및 고객 서비스: 역사적 대화를 맥락으로 사용하여 대명사 참조 오류와 스타일 변화를 줄이세요.
웹페이지/태그 텍스트: HTML/태그 텍스트 번역, 백보완과 렌더링을 용이하게 하기 위해 원래 구조를 유지하려고 노력하세요.

5. 생태와 경쟁 제품

생태계: GitHub 엔지니어링 예제와 기술 보고서를 제공하세요; Hugging Face는 장치 측과 클라우드 측에서 다양한 추론 비용을 선택할 수 있도록 다양한 정밀도/양자화 버전을 제공합니다.
경쟁 제품 참조: 오픈 소스 측면은 MarianMT, NLLB 시리즈, M2M100, SeamlessM4T 등과 비교할 수 있습니다; 폐쇄 소스 측면은 다양한 번역 API나 범용 대형 모델의 번역 기능을 번역하는 데 일반적으로 사용됩니다. 실제 선택 권고는 언어 범위, 형식 유지, 용어 일관성, 처리량/지연 지표를 기반으로 A/B 테스트로 진행됩니다.

6. 제한 및 주의사항

지표 전이 가능성: 공식 속도/메모리 데이터 및 효과 순위는 보통 특정 하드웨어, 정량화 및 추론 구성에 따라 다르며, 출시 전에 대상 장치에서 재테스트되어야 합니다.
프롬프트 의존성: 용어/문맥/형식 번역은 입력을 템플릿에 따라 엄격히 조직해야 하며, 그렇지 않으면 설명 출력이나 형식 변화가 발생할 수 있습니다.
소규모 언어와 구어체 스타일: 롱테일 언어, 속어, 강한 현장 텍스트는 여전히 오역되거나 생략될 수 있으므로, 용어집과 수동 샘플링을 도입하여 고리를 마무리하는 것이 권장됩니다.
장치와 클라우드 간의 일관성: 기기 측과 클라우드 측이 서로 다른 버전이나 양자화 정확도를 사용한다면, 출력 스타일이 완전히 일관되지 않을 수 있으며, 이는 프롬프트 단어와 용어 전략을 통해 수렴해야 합니다.

7. 프로젝트 주소

https://github.com/Tencent-Hunyuan/HY-MT

8. 자주 묻는 질문

Q: HY-MT1.5-1.8B는 어떤 '최종 변환' 시나리오에 적합한가요?

A: 모바일 번역, IM 임베디드 번역, 브라우저 스트로크 번역 등 지연에 민감하고 장치 자원이 제한적이며 오프라인 이용 가능이 필요한 애플리케이션에 적합합니다.

Q: HY-MT1.5-7B와 1.8B 중에서 어떻게 선택하나요? 둘 중 하나를 선택해야 하나요?

A: 장치 측 우선순위 1.8B, 클라우드 우선순위 7B; 기기 측에서 결과를 출력하고 클라우드에서 검토/재번역하여 더 안정적인 품질과 일관성을 얻을 수도 있습니다.

Q: HY-MT1.5의 "용어 기반/용어 개입"은 어떻게 작동하나요?

답변: 공식 용어 프롬프트 템플릿에 따르면, "출처 용어→ 대상 용어" 비교가 제약 조건으로 삽입되고, 본문 텍스트가 번역되어 용어의 일관성을 개선합니다.

Q: HY-MT1.5는 긴 대화 맥락 번역을 어떻게 하나요?

A: 역사적 대화를 맥락 블록 입력으로 사용하고, 맥락 번역 템플릿을 사용해 모델이 현재 문장을 번역하기 전에 맥락을 참조하도록 하세요.

Q: HY-MT1.5는 형식을 보존하는 번역에 어떤 텍스트를 사용하나요?

A: 태그나 태그가 포함된 텍스트(예: 웹 페이지 스니펫/구조화된 스니펫)에 적합합니다. 라벨이 안정적이고 잘 유지되는지 확인하기 위해 소량 샘플을 사용한 후 배치 공정으로 확장하는 것이 권장됩니다.

관련 기사

Zhipu 홍콩 주식 IPO가 IPO: 코드 2513을 출범하며, 2026년 1월 8일 홍콩증권거래소 본가에 상장될 예정입니다

HY-Motion 1.0 오픈 소스 분석: 텐센트의 훈원 10억 파라미터 DiT 원셩 액션 모델 입문 가이드

Mem0가 에이전트와 통합할 가치가 있을까요? 장기 기억력은 유용하지만, 경계를 관리해야 합니다

헤이스택은 어떤 팀에 적합한가요? 이것은 오히려 컴포스터블한 RAG 엔지니어링 프레임워크에 가깝습니다

추천 도구