돌아가기 AI 정보
Ali Tongyi가 Qwen3-VL-4B 및 8B 모델을 출시했으며 멀티모달 버전이 공식적으로 온라인에 공개되었습니다.

Ali Tongyi가 Qwen3-VL-4B 및 8B 모델을 출시했으며 멀티모달 버전이 공식적으로 온라인에 공개되었습니다.

AI 정보 Admin 114 회 조회

알리바바 클라우드 통이 첸웬(Tongyi Qianwen) 팀은 Qwen3-VL 모델 시리즈의 두 가지 새로운 오픈소스 버전인 Qwen3-VL-4B와 Qwen3-VL-8B를 GitHub에 출시했다고 발표했습니다. 공식 소개에 따르면, 이 두 모델은 Qwen3 아키텍처를 계승하며 이미지와 텍스트를 포함하는 멀티모달 작업에 최적화되어 있습니다. 이미지, 텍스트, 표 콘텐츠를 이해하고 생성적 답변과 복잡한 시각적 추론을 지원합니다.

기술 문서에 따르면, Qwen3-VL-4B는 경량 애플리케이션용으로 설계되어 성능과 구축 비용의 균형을 유지합니다. Qwen3-VL-8B는 더 높은 정확도와 향상된 시각적 이해 기능을 제공하여 과학 연구 및 기업 수준의 작업에 적합합니다. 관계자는 커뮤니티 사용자들이 모델 성능을 자유롭게 테스트하고 피드백을 제공할 수 있으며, 성공 사례와 실패 사례 모두 공개적으로 공유하는 것이 권장된다고 밝혔습니다. 이번 릴리스는 Tongyi의 오픈 소스 멀티모달 기능을 크게 확장한 것으로 평가됩니다.

자주 묻는 질문

질문: Qwen3-VL은 어떤 모델인가요?

A: Tongi Qianwen의 멀티모달 모델은 이미지와 텍스트 입력을 모두 처리할 수 있습니다.

질문: 이번 릴리스에는 어떤 새로운 버전이 포함되었나요?

답변: 두 개의 새로운 매개변수 규모 오픈 소스 모델인 Qwen3-VL-4B와 Qwen3-VL-8B가 추가되었습니다.

질문: 이 모델은 어디서 구입할 수 있나요?

A: 모델 코드와 가중치 파일은 Qwen 공식 GitHub 저장소에 게시되었습니다.

질문: 이전 버전과 비교해서 어떤 점이 개선되었나요?

A: 주로 시각적 이해력, OCR 정확도, 교차 모달 추론 능력을 향상시키고 추론 속도를 최적화합니다.

질문: 상업적으로나 지역적으로 배포할 수 있나요?

A: Qwen의 공식 오픈소스 라이선스 계약에 따르면, 조건을 준수하는 전제 하에 자유롭게 연구하고 배포할 수 있습니다.

추천 도구

더보기