2025년 9월 29일, DeepSeek은 실험 모델 DeepSeek-V3.2-Exp를 출시하여 V3.1-Terminus 기반의 DeepSeek Sparse Attention(DSA)을 선보였습니다. 공식적으로 DSA는 세분화된 Sparse Attention을 사용하여 출력 품질을 최소화하면서 긴 컨텍스트 학습 및 추론의 효율성을 크게 향상시킵니다. 내부 비교 결과, 전반적인 성능은 V3.1-Terminus와 유사한 것으로 나타났습니다. 이 모델은 이제 앱, 웹, API 에서 동시에 사용할 수 있습니다.
첨부된 설명서에 따르면 deepseek-chat과 deepseek-reasoner가 V3.2-Exp 로 전환되었습니다. 가격 페이지도 업데이트되어 API 가격이 50% 이상 인하 되었습니다. 현재 사양은 128KB context로 유지되며, non-thinking 모드와 thinking 모드의 기본 및 최대 출력 제한은 변경되지 않습니다. 가격 인하는 캐시 적중 및 캐시 미스 입력 가격뿐만 아니라 출력 가격에도 적용됩니다.
자주 묻는 질문
질문: V3.2-Exp의 핵심 변경 사항은 무엇입니까?
A: 우리는 품질을 희생하지 않고 비용을 절감하는 목표로 긴 맥락의 계산 효율성에 초점을 맞춰 DSA 스파스 어텐션을 도입했습니다.
질문: V3.1-Terminus와의 관계는 무엇인가요?
A: 이 버전은 실험적인 버전이며, 지속적으로 개선되고 있습니다. 벤치마크 성능은 거의 동일하며, 효율성 향상에 중점을 두고 있습니다.
질문: 지금 어디에서 구매할 수 있나요?
A: 이제 DeepSeek 앱, 웹 버전, API에서 이용할 수 있습니다.
질문: 컨텍스트와 출력 제한이 변경되나요?
A: 컨텍스트는 여전히 128KB입니다. 비사고/사고 모드의 기본 및 최대 출력 길이는 이전과 동일합니다.
질문: 가격은 얼마나 떨어질까요?
A: 가격 페이지에 새로운 등급(예: 입력 캐시 적중 시 토큰 100만 개당 $0.028, 미스 시 $0.28, 출력 시 $0.42)이 나열되어 있으며, 이는 이전 등급 대비 전체적으로 50% 이상 감소한 수치입니다. 자세한 내용은 공식 페이지를 참조하세요.