돌아가기 AI 정보
DeepSeek는 에이전트 시나리오를 위한 V3.2 및 V3.2-Speciale: 추론 우선 모델을 출시합니다

DeepSeek는 에이전트 시나리오를 위한 V3.2 및 V3.2-Speciale: 추론 우선 모델을 출시합니다

AI 정보 Admin 165 회 조회

두 달 전, DeepSeek는 실험용 모델 V3.2-Exp를 공개했으며, 사용자 방문을 통해 다양한 시나리오에서 V3.1-Terminus보다 열등하지 않음을 확인해 DSA의 희소한 주의 메커니즘의 효과를 검증했습니다. DeepSeek-V3.2와 DeepSeek-V3.2-Speciale의 최신 공식 버전이 이제 제공되었으며, V3.2는 공식 웹사이트, 앱, API에서 V3.2-Exp를 완전히 대체하여 기본 서비스 모델로 자리잡았습니다. 또한 Speciale 버전은 커뮤니티 평가 및 연구를 위한 임시 API 서비스로 개방되어 있습니다.

관계자에 따르면, V3.2의 목표는 추론 능력과 출력 길이 사이의 균형을 맞추어 Q&A나 일반 에이전트 같은 일상 시나리오에 적합하고, 공개 추론 벤치마크에서 GPT-5 수준에 도달하는 것입니다. 이는 Gemini-3.0-Pro보다 약간 낮고, Kimi-K2-Thinking보다 출력 길이와 계산 오버헤드가 더 제한적입니다. V3.2-Speciale는 장기적 사고 능력을 크게 향상시키고 DeepSeek-Math-V2의 정리 증명 능력을 통합하여 IMO, CMO, ICPC 월드 파이널, IOI 2025에서 금메달을 획득했으며, ICPC와 IOI의 성적은 각각 인간 플레이어 중 2위와 10위에 근접했습니다. 이 모델은 복잡한 추론 작업에 특화되어 있으며, 토큰 소모가 훨씬 많고, 현재 사고 모드 대화만 지원하고 도구 호출은 허용되지 않으며 최대 출력 길이는 128K입니다.

에이전트 응용 측면에서 DeepSeek-V3.2는 '사고'를 도구 호출에 직접 통합한 최초의 모델이 되었으며, 이는 사고 모드에서 여러 라운드의 '생각 + 호출 도구'를 지원할 뿐만 아니라 비사고 모드 호출도 지원합니다. 이 공식은 1,800개 이상의 환경과 85,000개의 복잡한 명령어를 종합하여 대규모 에이전트 훈련 데이터를 구축하여, 다양한 에이전트 평가에서 현재 오픈 소스 모델의 선도 수준에 도달했습니다. V3.2-Speciale는 임시 엔드포인트 base_url 구성을 통해 접근되며, 서비스는 2025년 12월 15일 베이징 시간 23:59에 종료될 예정입니다.

FAQ

Q: DeepSeek-V3.2와 V3.2-Speciale의 포지셔닝 차이는 무엇인가요?

A: V3.2는 일일 Q&A와 일반 에이전트를 대상으로 하며, 추론과 비용 균형을 강조합니다. V3.2-Speciale는 극한의 추론 능력을 추구하며, 어려운 수학과 프로그래밍 과제에 집중합니다.

Q: 현재 웹과 앱에서 호출되는 모델은 무엇인가요?

답변: DeepSeek은 기본 웹, 앱, 표준 API를 공식 DeepSeek-V3.2 버전으로 업그레이드했으며, 더 이상 V3.2-Exp를 사용하지 않습니다.

Q: V3.2-Speciale에 어떻게 접근할 수 있으며, 제한 사항은 무엇인가요?

A: API에서 특정 base_url를 설정해야 하며, 이 버전은 사고 모드 대화만 지원하고 도구 호출은 지원하지 않습니다. 최대 출력 길이는 128K이며, 서비스는 2025년 12월 15일까지 운영됩니다.

Q: "사고 모드에서의 도구 호출"이 정확히 무슨 뜻인가요?

A: V3.2는 추론 과정에서 도구 호출을 여러 번 삽입할 수 있으며, 도구 반환 결과와 함께 계속 생각할 수 있어 복잡하고 다단계 에이전트 작업 시나리오에 적합합니다.

Q: 두 모델 모두 이미 오픈 소스인가요?

A: 공식 V3.2와 V3.2-Speciale는 HuggingFace와 ModelScope에서 커뮤니티 다운로드를 위해 공개되었으며, 기술 보고서와 사고 모드 API 문서도 함께 제공됩니다.

DeepSeek V3.2 공식 버전 모델 분석 DeepSeekV3.2 Speciale Long thinking DeepSeekV3.2 벤치마크 GPT5 추론력 딥시크 V3.2와 제미니 3.0 프로 비교 DeepSeekV3.2와 KimiK2 간의 연산 능력 차이 DeepSeek V3.2는 일반적인 AIAgent 시나리오에 적합합니다 V3.2 특수 난이도의 수학적 추론 인공물 V3.2 스페셜레가 DeepSeekMathV2와 통합됨 DeepSeekV3.2DSA 희소주의 메커니즘 DeepSeek V3.2 다라운드 사고 도구 호출 DeepSeek V3.2 웹 앱이 완전히 출시되었습니다 DeepSeekV3.2 API 기본 서비스 모델 V3.2 Speciale 임시 엔드포인트 baseurl 설명 V3.2 Speciale 서비스 마감일 알림 DeepSeek V3.2 출력 길이와 비용 균형 V3.2 스페셜레의 최대 출력 길이는 128K입니다 DeepSeekV3.2의 공개 추론 목록 점수 V3.2 스페셜레IMO 수학 올림피아드 금메달 성적 V3.2 스페셜레의 CMO 대회 결과 V3.2 스페셜레ICPC 월드 파이널 레벨 V3.2 SpecialeIOI2025는 인류 상위 10위 안에 근접합니다 DeepSeek V3.2는 복잡한 다단계 작업에 적합합니다 DeepSeek V3.2 사고 모드 대화 경험 DeepSeekV3.2 비사고 모드 비용 제어 DeepSeekV3.2Agent 대규모 합성 데이터 DeepSeek V3.2 열차 1800 환경 세부사항 DeepSeekV32,8500 복합 명령어 데이터셋 DeepSeekV3.2는 오픈 소스 에이전트 평가를 주도합니다 V3.2 Speciale 는 어려운 프로그래밍 문제 해결에 특화되어 있습니다 DeepSeek V3.2는 일상 Q&A 사용에 적합합니다 DeepSeek V3.2는 V3.2 출시 노트를 대체합니다 딥시크 V3.2 vs. V3.1 터미너스 DeepSeekV3.2Exp 사용자 방문 효과 피드백 DeepSeek V3.2는 이 회사의 주요 모델로 적합합니다 DeepSeek V3.2 적응 도구는 AIAgent 프레임워크라고 불립니다 오픈 소스 DeepSeek V3.2 가중 다운로드 채널 V3.2 스페셜레 오픈소스 모델 가중치 획득 DeepSeek V3.2HuggingFace 모델 저장소 DeepSeekV3.2ModelScope를 다운로드하여 사용 DeepSeek V3.2 기술 보고서 및 API 문서 DeepSeek V3.2 또는 Speciale 선택 방법 DeepSeek V3.2는 어떤 개발자 시나리오에 적합한가요? 스페셜레 모델 토큰 소비 비용 평가 DeepSeekV3.2는 수학 프로그래밍 경연대회에서 사용됩니다 V3.2를 사용해 공통 에이전트 워크플로우를 구축하세요 DeepSeek V3.2 툴 호출과 보안 경계 DeepSeekV3.2 장문 추론 출력의 장점 스페셜레 사고 모드는 도구 제한을 지원하지 않습니다 DeepSeek V3.2는 기업 내 민영화 가능성 DeepSeek V3.2 다른 국내 대형 모델과 비교

추천 도구

더보기