Zhipu 플랫폼은 Z.ai GLM-4.6V 시리즈 시각 언어 모델 출시를 발표했으며, 여기에는 106B 파라미터 규모의 클라우드 및 고성능 클러스터 시나리오용 GLM-4.6V와 로컬 및 저지연 시나리오용 경량 버전 GLM-4.6V-Flash가 포함되어 있습니다. 공식 소개에 따르면, GLM-4.6V는 학습 시 최대 128K 토큰 컨텍스트를 지원하며, 이미지, 텍스트, 파일 같은 다중 모달 입력을 동시에 처리할 수 있고, 동일한 크기의 모델에서 높은 시각적 이해 능력을 달성할 수 있습니다.
기능 설계 측면에서 GLM-4.6V 시리즈는 비전 모델 계열에 네이티브 함수 호출 기능을 처음으로 통합하여, 이미지와 긴 문서를 이해한 기반 도구나 비즈니스 인터페이스를 트리거하여 멀티모달 에이전트 애플리케이션을 위한 인프라를 제공합니다. 개발자들은 Z.ai 가 제공하는 온라인 대화 페이지를 통해 모델을 경험하거나, API 인터페이스를 통해 자신의 비즈니스에 호출을 통합할 수 있습니다. 동시에 Hugging Face에서는 모델 가중치가 공개되어 컴퓨팅 파워가 뛰어난 팀이 로컬 또는 비공개로 배포할 수 있도록 편리하게 운영됩니다.
요금 측면에서 Z.ai 가 발표한 API 요금은 백만 토큰 단위로 계산되며, GLM-4.6V 클라우드 추론은 입출력에 대해 별도로 청구되며, 플래시 버전은 현재 무료로 표시되어 비용 민감성과 지연 시 민감한 응용 시나리오에 적합합니다. 구체적인 가격, 한정 기간 제공, 할당량 규칙은 개발자 문서와 콘솔 홍보에 따라 달라지며, 사용자는 멀티모달 데이터 업로드에 대한 계정 할당량, 보안 준수, 개인정보 보호 문제를 주의 깊게 고려해야 합니다.
자주 묻는
질문: GLM-4.6V는 어떤 모델인가요?
답변: GLM-4.6V는 Z.ai 에서 출시한 다중 모달 대형 모델로, 이미지와 텍스트 같은 입력을 동시에 처리할 수 있고 긴 맥락과 추론 기능을 지원합니다.
Q: GLM-4.6V-플래시와 GLM-4.6V의 차이점은 무엇인가요?
답변: GLM-4.6V-플래시는 가볍고 고속 버전으로, 온프레미스 배포와 저지연 애플리케이션에 더 적합합니다. 반면 GLM-4.6V는 클라우드 및 고성능 클러스터 시나리오에 적합합니다.
Q: GLM-4.6V 시리즈 모델을 어떻게 체험할 수 있나요?
A: 일반 사용자는 Z.ai의 온라인 채팅 페이지를 통해 경험할 수 있으며, 개발자는 공식 API를 통해 자신의 앱에 통합할 수 있습니다.
Q: GLM-4.6V가 기능 호출을 지원하나요?
A: GLM-4.6V 시리즈는 이미지와 문서를 파싱한 후 외부 도구나 비즈니스 인터페이스를 호출하는 데 사용할 수 있는 네이티브 함수 호출을 지원하여 멀티모달 에이전트를 쉽게 구축할 수 있습니다.
Q: GLM-4.6V와 GLM-4.6V-플래시의 가격은 얼마인가요?
답변: GLM-4.6V는 API 호출에 대해 입력과 출력에 대해 백만 토큰 단위로 요금이 부과되며, 공식 가격 페이지에 따르면 GLM-4.6V-Flash는 현재 무료로 표시되어 있습니다.