Qwen 팀은 Qwen3.5-35B-A3B, Qwen3.5-122B-A10B, Qwen3.5-27B 등 중형 모델 시리즈를 출시했으며, 온라인 제작용 Qwen3.5-플래시 버전도 제공했습니다. 공식 정보에 따르면, 플래시는 35B-A3B 기능과 연계되어 있으며, 더 낮은 컴퓨팅 비용으로 포괄적인 인텔리전스 성능을 향상시키고, 더 복잡한 에이전트 사용 시나리오에서 대형 모델과의 격차를 줄이는 데 중점을 두고 있습니다.
이 시리즈 모델은 Hugging Face와 ModelScope 컬렉션에 등재되어 있습니다; 클라우드 API 측면에서는 알리바바 클라우드 모델 스튜디오가 Qwen 관련 인터페이스와 모델 리스트를 제공하는 반면, 플래시는 기본 1M 컨텍스트 창과 공식 내장 도구 기능에 집중합니다. 사용자는 긴 컨텍스트, 도구 호출 권한 및 데이터 준수, 온프레미스 배포 시 메모리 사용량 및 추론 매개변수 구성 차이로 인한 비용과 지연 시간 변화에 주의를 기울여야 합니다.
자주 묻는 질문
Q: Qwen 3.5-플래시 버전의 포지셔닝은 어떻게 되나요?
답변: Qwen 3.5-Flash는 온라인 제작 및 호스팅용 버전으로, 공식적으로 35B-A3B 기능과 연계되어 더 긴 컨텍스트와 내장 도구 기능을 제공합니다.
Q: Qwen3.5-35B-A3B, 27B, 122B-A10B는 어디서 구할 수 있나요?
A: 관련 모델은 Hugging Face와 ModelScope에 컬렉션 형태로 공개되었으며, 모델 카드 설명서에 따라 다운로드하여 사용할 수 있습니다.
Q: Qwen 3.5-Flash 기본 1M 컨텍스트가 모든 작업에 적합한가요?
답변: 긴 컨텍스트는 대형 문서, 긴 코드, 다중 라운드 에이전트 작업에 더 적합하지만, 비용이 더 높고 응답 시간이 길 수 있습니다.
Q: Qwen3.5 시리즈가 툴 호출과 함수 호출을 지원하나요?
A: 클라우드 인터페이스의 공식 설명에는 내장 도구 관련 기능이 포함되어 있습니다; 구체적인 도구와 권한은 플랫폼 문서와 콘솔 설정에 따라 다릅니다.