1. 초록
텐센트-HY-MT1.5(HY-MT)는 텐센트의 오픈 소스 기계 번역 모델 제품군으로, 1.8B(부분 측면/저자원)와 7B(부분 클라우드/고품질) 두 가지 규모를 포함합니다. 관계자는 "장치 측 + 클라우드 측"에 대한 협력적 배포를 강조합니다: 기기 내 낮은 지연과 낮은 메모리 사용량, 클라우드에서의 더 강력한 품질과 더 견고한 복잡한 장면 성능, 그리고 33+ 언어/방언(일부 민한어 및 중국어 방언 포함) 상호 번역 기능을 포함합니다.
2. 핵심 특징
1. 엔드 클라우드의 듀얼 모델 커버리지: 1.8B는 소비자용 하드웨어와 오프라인/실시간 변환에 적응함; 7B는 더 높은 품질의 버전이며 클라우드 배치 및 수요가 많은 시나리오에 적합합니다.
2. 속도 및 자원 친화적: 1.8B는 양자화된 버전을 제공하며, 공식 용량은 약 1GB의 메모리 사용량과 하드웨어 및 추론 프레임워크에 따라 50개의 토큰의 저지연 데이터를 제공합니다.
3. 생산 향상 기능: 네이티브로 용어 개입(사용자 지정 용어 비교), 긴 대화 문맥 번역, 서식화된 텍스트 번역(가능한 한 라벨/타이포그래피 유지)을 지원합니다.
4. 다국어 방송: 중국어, 영어, 일본어 등 일반적인 언어 외에도 다양한 소규모 언어도 포함합니다; 국경 간 전자상거래, 콘텐츠 국제화, 다국어 고객 서비스에 적합합니다.
3. 설치
- 환경 준비: 공식 권장 Transformers 버전(저장소 예제는 고정된 버전 번호)을 우선적으로 사용하고 GPU/CPU 추론 환경을 준비하는 것이 권장됩니다.
- 모델 획득: Hugging Face에서 해당 가중치(1.8B/7B, FP8, GPTQ Int4 등)를 다운로드하세요.
- 추론 방법: 모델 카드/창고 예제에 따라 번역 프롬프트 템플릿을 구축합니다(중국어와 외국 번역, 외국 번역, 용어/문맥/형식 번역 템플릿은 다릅니다). 그리고 생성 인터페이스를 호출하여 번역을 출력합니다.
4. 일반적인 사용 사례
- 기기 측의 오프라인 번역: 모바일, 데스크톱, 브라우저 플러그인, 입력법/획 번역과 같은 저지연 시나리오.
- 클라우드 내 고품질 번역: 문서 일괄 번역, 국제 콘텐츠 제작, 다국어 지식 기반 구축.
- 산업 용어의 일관성: 의료, 법률, 재무, 소프트웨어 공학 문서 등은 "용어 편차가 없는" 문구를 요구합니다.
- 다중 대화 및 고객 서비스: 역사적 대화를 맥락으로 사용하여 대명사 참조 오류와 스타일 변화를 줄이세요.
- 웹페이지/태그 텍스트: HTML/태그 텍스트 번역, 백보완과 렌더링을 용이하게 하기 위해 원래 구조를 유지하려고 노력하세요.
5. 생태와 경쟁 제품
- 생태계: GitHub 엔지니어링 예제와 기술 보고서를 제공하세요; Hugging Face는 장치 측과 클라우드 측에서 다양한 추론 비용을 선택할 수 있도록 다양한 정밀도/양자화 버전을 제공합니다.
- 경쟁 제품 참조: 오픈 소스 측면은 MarianMT, NLLB 시리즈, M2M100, SeamlessM4T 등과 비교할 수 있습니다; 폐쇄 소스 측면은 다양한 번역 API나 범용 대형 모델의 번역 기능을 번역하는 데 일반적으로 사용됩니다. 실제 선택 권고는 언어 범위, 형식 유지, 용어 일관성, 처리량/지연 지표를 기반으로 A/B 테스트로 진행됩니다.
6. 제한 및 주의사항
- 지표 전이 가능성: 공식 속도/메모리 데이터 및 효과 순위는 보통 특정 하드웨어, 정량화 및 추론 구성에 따라 다르며, 출시 전에 대상 장치에서 재테스트되어야 합니다.
- 프롬프트 의존성: 용어/문맥/형식 번역은 입력을 템플릿에 따라 엄격히 조직해야 하며, 그렇지 않으면 설명 출력이나 형식 변화가 발생할 수 있습니다.
- 소규모 언어와 구어체 스타일: 롱테일 언어, 속어, 강한 현장 텍스트는 여전히 오역되거나 생략될 수 있으므로, 용어집과 수동 샘플링을 도입하여 고리를 마무리하는 것이 권장됩니다.
- 장치와 클라우드 간의 일관성: 기기 측과 클라우드 측이 서로 다른 버전이나 양자화 정확도를 사용한다면, 출력 스타일이 완전히 일관되지 않을 수 있으며, 이는 프롬프트 단어와 용어 전략을 통해 수렴해야 합니다.
7. 프로젝트 주소
https://github.com/Tencent-Hunyuan/HY-MT
8. 자주 묻는 질문
Q: HY-MT1.5-1.8B는 어떤 '최종 변환' 시나리오에 적합한가요?
A: 모바일 번역, IM 임베디드 번역, 브라우저 스트로크 번역 등 지연에 민감하고 장치 자원이 제한적이며 오프라인 이용 가능이 필요한 애플리케이션에 적합합니다.
Q: HY-MT1.5-7B와 1.8B 중에서 어떻게 선택하나요? 둘 중 하나를 선택해야 하나요?
A: 장치 측 우선순위 1.8B, 클라우드 우선순위 7B; 기기 측에서 결과를 출력하고 클라우드에서 검토/재번역하여 더 안정적인 품질과 일관성을 얻을 수도 있습니다.
Q: HY-MT1.5의 "용어 기반/용어 개입"은 어떻게 작동하나요?
답변: 공식 용어 프롬프트 템플릿에 따르면, "출처 용어→ 대상 용어" 비교가 제약 조건으로 삽입되고, 본문 텍스트가 번역되어 용어의 일관성을 개선합니다.
Q: HY-MT1.5는 긴 대화 맥락 번역을 어떻게 하나요?
A: 역사적 대화를 맥락 블록 입력으로 사용하고, 맥락 번역 템플릿을 사용해 모델이 현재 문장을 번역하기 전에 맥락을 참조하도록 하세요.
Q: HY-MT1.5는 형식을 보존하는 번역에 어떤 텍스트를 사용하나요?
A: 태그나 태그가 포함된 텍스트(예: 웹 페이지 스니펫/구조화된 스니펫)에 적합합니다. 라벨이 안정적이고 잘 유지되는지 확인하기 위해 소량 샘플을 사용한 후 배치 공정으로 확장하는 것이 권장됩니다.