두 달 전, DeepSeek는 실험용 모델 V3.2-Exp를 공개했으며, 사용자 방문을 통해 다양한 시나리오에서 V3.1-Terminus보다 열등하지 않음을 확인해 DSA의 희소한 주의 메커니즘의 효과를 검증했습니다. DeepSeek-V3.2와 DeepSeek-V3.2-Speciale의 최신 공식 버전이 이제 제공되었으며, V3.2는 공식 웹사이트, 앱, API에서 V3.2-Exp를 완전히 대체하여 기본 서비스 모델로 자리잡았습니다. 또한 Speciale 버전은 커뮤니티 평가 및 연구를 위한 임시 API 서비스로 개방되어 있습니다.
관계자에 따르면, V3.2의 목표는 추론 능력과 출력 길이 사이의 균형을 맞추어 Q&A나 일반 에이전트 같은 일상 시나리오에 적합하고, 공개 추론 벤치마크에서 GPT-5 수준에 도달하는 것입니다. 이는 Gemini-3.0-Pro보다 약간 낮고, Kimi-K2-Thinking보다 출력 길이와 계산 오버헤드가 더 제한적입니다. V3.2-Speciale는 장기적 사고 능력을 크게 향상시키고 DeepSeek-Math-V2의 정리 증명 능력을 통합하여 IMO, CMO, ICPC 월드 파이널, IOI 2025에서 금메달을 획득했으며, ICPC와 IOI의 성적은 각각 인간 플레이어 중 2위와 10위에 근접했습니다. 이 모델은 복잡한 추론 작업에 특화되어 있으며, 토큰 소모가 훨씬 많고, 현재 사고 모드 대화만 지원하고 도구 호출은 허용되지 않으며 최대 출력 길이는 128K입니다.
에이전트 응용 측면에서 DeepSeek-V3.2는 '사고'를 도구 호출에 직접 통합한 최초의 모델이 되었으며, 이는 사고 모드에서 여러 라운드의 '생각 + 호출 도구'를 지원할 뿐만 아니라 비사고 모드 호출도 지원합니다. 이 공식은 1,800개 이상의 환경과 85,000개의 복잡한 명령어를 종합하여 대규모 에이전트 훈련 데이터를 구축하여, 다양한 에이전트 평가에서 현재 오픈 소스 모델의 선도 수준에 도달했습니다. V3.2-Speciale는 임시 엔드포인트 base_url 구성을 통해 접근되며, 서비스는 2025년 12월 15일 베이징 시간 23:59에 종료될 예정입니다.
FAQ
Q: DeepSeek-V3.2와 V3.2-Speciale의 포지셔닝 차이는 무엇인가요?
A: V3.2는 일일 Q&A와 일반 에이전트를 대상으로 하며, 추론과 비용 균형을 강조합니다. V3.2-Speciale는 극한의 추론 능력을 추구하며, 어려운 수학과 프로그래밍 과제에 집중합니다.
Q: 현재 웹과 앱에서 호출되는 모델은 무엇인가요?
답변: DeepSeek은 기본 웹, 앱, 표준 API를 공식 DeepSeek-V3.2 버전으로 업그레이드했으며, 더 이상 V3.2-Exp를 사용하지 않습니다.
Q: V3.2-Speciale에 어떻게 접근할 수 있으며, 제한 사항은 무엇인가요?
A: API에서 특정 base_url를 설정해야 하며, 이 버전은 사고 모드 대화만 지원하고 도구 호출은 지원하지 않습니다. 최대 출력 길이는 128K이며, 서비스는 2025년 12월 15일까지 운영됩니다.
Q: "사고 모드에서의 도구 호출"이 정확히 무슨 뜻인가요?
A: V3.2는 추론 과정에서 도구 호출을 여러 번 삽입할 수 있으며, 도구 반환 결과와 함께 계속 생각할 수 있어 복잡하고 다단계 에이전트 작업 시나리오에 적합합니다.
Q: 두 모델 모두 이미 오픈 소스인가요?
A: 공식 V3.2와 V3.2-Speciale는 HuggingFace와 ModelScope에서 커뮤니티 다운로드를 위해 공개되었으며, 기술 보고서와 사고 모드 API 문서도 함께 제공됩니다.