텐센트 훈위안 팀은 텐센트 클라우드 API를 통해 개발자와 기업에 개방된 최신 언어 모델인 텐센트 HY 2.0의 공식 출시를 발표했습니다. 이번 업그레이드는 총 매개변수 규모 4,060억, 활성화 매개변수 320억, 최대 256K 컨텍스트 윈도우를 지원하는 하이브리드 전문가(MoE) 아키텍처를 채택하여 이전 세대 모델에 비해 수학적 추론, 코드 생성, 복잡한 작업 실행이 크게 향상되었습니다. 공식 소개에 따르면, HY 2.0은 IMO-AnswerBench에서 73.4점을 받았으며, SWE-bench Verified와 Tau2-Bench 같은 에이전트 과제 점수도 크게 상승했습니다.
HY 2.0은 두 가지 최적화된 버전을 제공합니다: 텐센트 HY 2.0 Think는 심층 추론, 코드 생성, 복잡한 명령어 시나리오를 목표로 하며, 클라우드 인터페이스는 최대 입력 128K, 출력 64K를 지원하며 긴 텍스트, 다중 라운드 대화, 난이도 추론 능력에 더 중점을 둡니다; 텐센트 HY 2.0 인스티처는 일상 대화, 생성, 고동시성 서비스를 목표로 하며, 최대 입력 128K, 출력이 16K로 응답성과 보편적 안정성을 강조합니다. 훈련 전략 측면에서 관계자는 RLVR + RLHF 이중 단계 강화 학습 도입을 강조하며, '사고 깊이'와 생성 효율성을 길이 페널티와 작업 모닥박스 설계와 균형 있게 맞추고 있습니다.
현재 HY 2.0은 텐센트 위안바오와 같은 자체 애플리케이션과 연결되어 있으며, 텐센트 클라우드에서 API 호출과 기업 접근 기능을 제공합니다. 구체적인 가격, 현재 제한 전략 및 기타 기술적 세부사항은 텐센트 클라우드 공식 문서에 달려 있으며, 일부 내부 벤치마크의 원본 데이터는 아직 완전히 공개되지 않았고, 외부 성능 비교는 주로 텐센트가 발표한 지표와 지침에 기반하고 있습니다.
FAQ
Q: 텐센트 HY 2.0이란 무엇인가요?
답변: 이 모델은 텐센트 훈위안의 범용 대형 언어 모델의 최신 세대로, MoE 아키텍처를 사용하며, 총 매개변수는 406B, 활성화된 32B로, 추론, 코드, 장문 기능에 중점을 두고 있습니다.
Q: 이번 릴리스의 구체적인 버전은 무엇인가요?
A: 텍스트 모델은 두 가지 주요 유형이 있습니다: Tencent HY 2.0 Think(깊은 추론용)와 Tencent HY 2.0 Instruct(일반 대화 및 저작용)입니다.
Q: HY 2.0의 맥락 길이와 입출력 사양은 어떻게 되나요?
A: 패밀리 모델은 최대 256K 컨텍스트를 지원한다고 주장하며, 현재 클라우드 Think/Instruct 인터페이스의 최대 입력은 128K이며, Think의 최대 출력은 64K, Instruct의 최대 출력은 16K입니다.
Q: Think와 Instruct의 주요 차이점은 무엇인가요?
A: Think는 복잡한 추론, 코드 생성, 에이전트 툴 호출과 같은 '느린 사고' 작업에 더 적합합니다. Instruct는 동시성과 응답 요구가 높은 채팅, 글쓰기, 비즈니스 Q&A 상황에 더 적합합니다.
Q: 완전히 오픈 소스인가요? 접근 및 활용 방법은 무엇인가요?
답변: HY 2.0은 현재 텐센트 클라우드 API 형태의 상용 서비스를 제공하며, 일부 텐센트 제품에 구현되었습니다.