Qwen 팀은 추론 모델 Qwen3-Max-Thinking을 출시하고 Qwen Chat에서 '적응적 추론' 경험을 열었습니다. 공식 및 관련 보고서에 따르면, 이 모델은 대규모 훈련과 강화 학습을 통해 추론, 지식, 도구 사용 및 에이전트 역량을 향상시키며, 탐색, 메모리, 코드 인터프리터 같은 도구를 대화 중에 호출할지 자동으로 결정하여 수동 선택과 프로세스 전환을 줄일 수 있습니다.
기술적 장점에는 '시험 기준 스케일(scale-on-test)'도 포함되어 있는데, 이는 복잡한 문제에 대해 여러 차례 자기 성찰과 교정을 통해 최종 답변의 질을 향상시키는 것입니다. 공개된 벤치마크 점수에 따르면 HMMT 2월에는 98.0점, 검색이 포함된 인류의 마지막 시험(HLE)의 '에이전트 서치' 시나리오에서는 49.8점을 기록했습니다. 개발자 측에서는 알리바바 클라우드 모델 스튜디오 문서에 따르면 OpenAI 호환 채팅 완료 및 응답 인터페이스를 통해 지정된 버전의 모델을 호출할 수 있습니다.
자주 묻는 질문
Qwen3-Max-Thinking이 주로 어떤 문제를 해결하나요?
A: 복잡한 추론과 주체성 작업을 목표로 하며, 필요할 때 도구를 자동으로 사용해 정보와 계산을 완료하고, 문제 해결의 안정성을 높이기 위해 여러 차례의 성찰을 사용합니다.
Q: Qwen3-Max-Thinking의 "적응형 도구 호출"은 무슨 뜻인가요?
A: 모델은 사용자가 수동으로 프로세스를 지정하는 대신 검색, 메모리, 코드 인터프리터 같은 기능을 한 번의 작업에서 자동으로 선택할 수 있습니다.
Q: Qwen3-Max-Thinking은 API를 통해 어떻게 접근하나요?
A: 알리바바 클라우드 모델 스튜디오에서 OpenAI 호환 채팅 완료 또는 응답 API를 사용해 문서 매개변수와 모델 이름에 따라 해당 버전을 호출할 수 있습니다.