DeepSeek publie la version V3.2-Exp : Présentation de DSA basé sur la version V3.1-Terminus, rendant le contexte long plus efficace

Informations sur l’IA • Admin • 29/09/2025 • 87 vues

Le 29 septembre 2025, DeepSeek a publié le modèle expérimental DeepSeek-V3.2-Exp , qui introduit DeepSeek Sparse Attention (DSA) sur la version V3.1-Terminus . Officiellement, DSA utilise une attention parcimonieuse fine pour améliorer significativement l'efficacité de l'apprentissage et de l'inférence en contexte long, tout en minimisant la qualité des résultats. Des comparaisons internes montrent que ses performances globales sont comparables à celles de la version V3.1-Terminus. Le modèle est désormais disponible simultanément sur l'application, le web et l'API .

La documentation jointe indique que deepseek-chat et deepseek-reasoner sont passés à la version 3.2-Exp . La page des tarifs a également été mise à jour, annonçant une réduction de plus de 50 % du prix des API . La spécification actuelle reste à 128 Ko de contexte , et les limites de sortie par défaut et maximale pour les modes de pensée et de non-réflexion restent inchangées. La réduction de prix s'applique aux prix d'entrée pour les hits et les miss de cache, ainsi qu'aux prix de sortie.

Questions fréquemment posées

Q : Quels sont les principaux changements dans la V3.2-Exp ?

R : Nous avons introduit l’attention parcimonieuse DSA, en nous concentrant sur l’efficacité de calcul des contextes longs, dans le but de réduire les coûts sans sacrifier la qualité.

Q : Quel est le rapport avec V3.1-Terminus ?

R : Il s'agit d'une version expérimentale qui est itérée. Les performances de référence sont sensiblement les mêmes et l'accent est mis sur l'amélioration de l'efficacité.

Q : Où est-il disponible maintenant ?

R : Il est désormais disponible sur l'application, la version Web et l'API de DeepSeek.

Q : Le contexte et les limites de sortie vont-ils changer ?

R : Le contexte est toujours de 128 Ko ; les longueurs de sortie par défaut et maximales pour les modes non-pensant/pensant sont les mêmes qu'avant.

Q : De combien le prix va-t-il baisser ?

R : La page des tarifs répertorie les nouveaux niveaux (par exemple, le cache d'entrée atteint 0,028 $/million de jetons, l'échec 0,28 $, la sortie 0,42 $), ce qui représente une baisse globale de plus de 50 % par rapport au niveau précédent. Veuillez consulter la page officielle pour plus de détails.

DeepSeek publie la version V3.2-Exp : Présentation de DSA basé sur la version V3.1-Terminus, rendant le contexte long plus efficace

Articles connexes

Actualités IA 24h/24 : Lancement du contrôle parental OpenAI, baisse des prix et itérations de DeepSeek

ChatGPT lance des fonctionnalités de contrôle parental : notamment le premier système de notification de sécurité « risque d'automutilation chez les jeunes »

Kimi K3 officiellement lancé : 2,8 trillions de paramètres misant sur des millions de contextes et un poids ouvert

Mistral Studio ajoute la gestion des versions de prompts : l’IA d’entreprise gère désormais les actifs comportementaux

Outils Recommandés

DeepSeek publie la version V3.2-Exp : Présentation de DSA basé sur la version V3.1-Terminus, rendant le contexte long plus efficace

Articles connexes

Actualités IA 24h/24 : Lancement du contrôle parental OpenAI, baisse des prix et itérations de DeepSeek

ChatGPT lance des fonctionnalités de contrôle parental : notamment le premier système de notification de sécurité « risque d&#39;automutilation chez les jeunes »

Kimi K3 officiellement lancé : 2,8 trillions de paramètres misant sur des millions de contextes et un poids ouvert

Mistral Studio ajoute la gestion des versions de prompts : l’IA d’entreprise gère désormais les actifs comportementaux

Outils Recommandés

Soumettre un outil IA

Veuillez confirmer les informations de soumission

ChatGPT lance des fonctionnalités de contrôle parental : notamment le premier système de notification de sécurité « risque d'automutilation chez les jeunes »