Retour à Informations sur l’IA
DeepSeek publie la version V3.2-Exp : Présentation de DSA basé sur la version V3.1-Terminus, rendant le contexte long plus efficace

DeepSeek publie la version V3.2-Exp : Présentation de DSA basé sur la version V3.1-Terminus, rendant le contexte long plus efficace

Informations sur l’IA Admin 80 vues

Le 29 septembre 2025, DeepSeek a publié le modèle expérimental DeepSeek-V3.2-Exp , qui introduit DeepSeek Sparse Attention (DSA) sur la version V3.1-Terminus . Officiellement, DSA utilise une attention parcimonieuse fine pour améliorer significativement l'efficacité de l'apprentissage et de l'inférence en contexte long, tout en minimisant la qualité des résultats. Des comparaisons internes montrent que ses performances globales sont comparables à celles de la version V3.1-Terminus. Le modèle est désormais disponible simultanément sur l'application, le web et l'API .

La documentation jointe indique que deepseek-chat et deepseek-reasoner sont passés à la version 3.2-Exp . La page des tarifs a également été mise à jour, annonçant une réduction de plus de 50 % du prix des API . La spécification actuelle reste à 128 Ko de contexte , et les limites de sortie par défaut et maximale pour les modes de pensée et de non-réflexion restent inchangées. La réduction de prix s'applique aux prix d'entrée pour les hits et les miss de cache, ainsi qu'aux prix de sortie.

Questions fréquemment posées

Q : Quels sont les principaux changements dans la V3.2-Exp ?

R : Nous avons introduit l’attention parcimonieuse DSA, en nous concentrant sur l’efficacité de calcul des contextes longs, dans le but de réduire les coûts sans sacrifier la qualité.

Q : Quel est le rapport avec V3.1-Terminus ?

R : Il s'agit d'une version expérimentale qui est itérée. Les performances de référence sont sensiblement les mêmes et l'accent est mis sur l'amélioration de l'efficacité.

Q : Où est-il disponible maintenant ?

R : Il est désormais disponible sur l'application, la version Web et l'API de DeepSeek.

Q : Le contexte et les limites de sortie vont-ils changer ?

R : Le contexte est toujours de 128 Ko ; les longueurs de sortie par défaut et maximales pour les modes non-pensant/pensant sont les mêmes qu'avant.

Q : De combien le prix va-t-il baisser ?

R : La page des tarifs répertorie les nouveaux niveaux (par exemple, le cache d'entrée atteint 0,028 $/million de jetons, l'échec 0,28 $, la sortie 0,42 $), ce qui représente une baisse globale de plus de 50 % par rapport au niveau précédent. Veuillez consulter la page officielle pour plus de détails.

Outils Recommandés

Plus