돌아가기 AI 정보
Qwen, Qwen3-VL-30B-A3B Instruct/Thinking 출시: 3B 활성화 매개변수, FP8을 지원하는 새로운 다중 모드 조합

Qwen, Qwen3-VL-30B-A3B Instruct/Thinking 출시: 3B 활성화 매개변수, FP8을 지원하는 새로운 다중 모드 조합

AI 정보 Admin 209 회 조회

2025년 10월 4일, Qwen은 코드베이스에서 두 가지 새로운 멀티모달 모델인 Qwen3-VL-30B-A3B-Instruct와 -Thinking의 출시를 공식 발표했으며, 동시에 FP8 양자화 버전을 제공했습니다. 이전에는 더 큰 모델인 Qwen3-VL-235B-A22B가 9월에 출시되어 FP8 변형을 제공하기 시작했습니다. 30B-A3B는 Mixture-of-Experts 아키텍처를 사용하며 단일 추론당 약 3B 개의 활성화 매개변수를 갖습니다. 목표는 Qwen3-VL의 기능을 유지하면서 처리량과 배포 효율성을 크게 향상시키는 것입니다. 공식 채널에서는 STEM, VQA, OCR, 비디오 이해, 에이전트 등의 작업에서 GPT-5-Mini 및 Claude 4 Sonnet과 경쟁할 수 있으며 일부 벤치마크에서는 "종종 선두"를 달리고 있다고 주장하지만, 아직 독립적인 평가가 진행 중입니다.

Qwen Chat은 현재 선택적 모델 액세스를 제공하며, HuggingFace와 ModelScope는 관련 가중치 및 양자화 버전을 출시했습니다. API 페이지에는 모델 시리즈도 나열되어 있습니다. 릴리스 게시물과 저장소 로그는 공식 정보이며, 일부 성능 비교는 공급업체에서 직접 보고한 것입니다. 타사 복제 실험 없이 "같다/초과한다"는 것이 확실한 진술이라고 결론짓는 것은 적절하지 않습니다. 비용과 배포에 중점을 둔 팀의 경우, FP8 버전은 메모리 및 대역폭 사용량을 줄이고 처리량을 향상시키는 것을 목표로 하지만, 구체적인 이점은 하드웨어 및 추론 스택에 따라 달라집니다. 프로덕션 환경으로 전환하기 전에 대상 데이터 세트 및 추론 시나리오에 대한 A/B 테스트를 수행하는 것이 좋습니다.

자주 묻는 질문

질문: Qwen3-VL-30B-A3B는 언제 출시되나요?

A: 공식 저장소 뉴스 기사에 따르면 출시일은 2025년 10월 4일입니다. 관련 블로그와 모델 카드는 그날 이후 점진적으로 업데이트될 예정입니다.

질문: 소위 "3B 활성화 매개변수"는 무엇을 의미합니까?

A: 이는 MoE(Mixture of Experts) 아키텍처의 특징입니다. 전체 모델은 약 30B개의 매개변수를 갖지만, 각 순방향 패스에서 약 3B만 활성화되어 비용 효율성과 처리량을 향상시키는 데 도움이 됩니다.

질문: FP8 버전은 무슨 용도로 쓰이나요?

A: FP8 양자화는 추론 효율성과 리소스 사용을 최적화합니다. 원칙적으로 비디오 메모리 및 대역폭 요구 사항을 줄이고 처리량을 향상시킬 수 있습니다. 이점은 하드웨어 및 구현 방식에 따라 달라집니다.

질문: GPT-5-Mini와 Claude 4 Sonnet을 비교하는 것은 신뢰할 수 있나요?

A: 이는 제조사의 자체 발표입니다. 제3자 재현 실험이나 공개 벤치마크 정보가 부족합니다. 이는 홍보로 간주되어야 합니다. 독립적인 평가를 기다리는 것이 좋습니다.

질문: 웨이트 트레이닝을 어디서 체험하거나 받을 수 있나요?

A: Qwen Chat은 온라인 체험판을 제공하고, HuggingFace와 ModelScope는 모델 및 양자화 버전을 제공합니다. 기업은 Alibaba Cloud Model Studio의 API를 통해 다양한 모델에 접근할 수 있습니다.

추천 도구

더보기