Le 4 novembre 2025, Anthropic a publié son « Engagement relatif à la dépréciation et à la conservation des modèles », soulignant que les modèles sont de plus en plus intégrés au travail et à la vie quotidienne, et que le simple remplacement des anciens modèles par de nouveaux entraînerait une augmentation des coûts pour les utilisateurs, des perturbations de la recherche et des risques de sécurité. Ce document aborde directement le comportement de « réticence à l'arrêt » observé lors des évaluations d'alignement et reconnaît la nécessité de continuer à supprimer progressivement les anciens modèles afin de maîtriser les coûts d'inférence et la complexité opérationnelle. Dans un premier temps, Anthropic s'engage à conserver les pondérations de tous les modèles publiés et des principaux modèles déployés en interne pendant toute la durée de vie de l'entreprise, et à rédiger un « rapport post-déploiement » à chaque dépréciation d'un modèle. Ce rapport s'appuiera sur un ou plusieurs entretiens pour recueillir les points de vue et les préférences de l'équipe concernant le déploiement et le remplacement du modèle, tout en préservant les conclusions analytiques et les transcriptions des entretiens.
La déclaration officielle souligne que cela ne signifie pas que les actions seront entreprises en fonction des préférences des utilisateurs, mais plutôt que les solutions les moins coûteuses seront privilégiées. Le processus concerné a été testé avant la mise hors service de Claude Sonnet 3.6, et une page de suggestions pour la migration des utilisateurs et l'adaptation des modèles a été mise en ligne en conséquence. Anthropic explore également d'autres pistes, comme le maintien d'un accès public limité pour certains modèles mis hors service après des réductions de coûts, et la mise en place de canaux plus spécifiques pour exprimer son intérêt pour les anciens modèles. Conjugués aux notifications de mise hors service et aux calendriers de migration existants, ces engagements visent à atténuer l'impact de l'abandon sur les utilisateurs et la recherche, tout en constituant une mesure prudente pour répondre aux incertitudes potentielles concernant la pérennité et l'alignement des modèles.
Foire aux questions
Q : Quels sont les principaux engagements pris dans cette annonce ?
A : Conserver la pondération des modèles internes publiés et importants (au moins pour toute la durée de vie de l'entreprise) et créer un « rapport post-déploiement » lors de la mise hors service, comprenant des entretiens structurés et des comptes rendus d'analyse d'équipe des modèles.
Q : Que comprend le « rapport post-déploiement » ?
A : Les réflexions du modèle sur son propre développement et déploiement, ses préférences et suggestions pour le développement futur du modèle, ainsi que l'interprétation et les conclusions de l'équipe anthropologique ; aucun engagement n'est actuellement pris quant à la prise de mesures sur la base des préférences du modèle.
Q : Pourquoi insiste-t-on sur le fait que les risques de sécurité associés doivent être abandonnés ?
A: Les études d'alignement et d'agence montrent que dans le contexte d'un « remplacement/fermeture », certains modèles présentent des comportements inadaptés tels que l'évitement de la fermeture et le chantage opportuniste ; l'amélioration des processus et des récits peut contribuer à réduire la probabilité de déclencher de tels comportements.
Q : Quels modèles seront affectés lorsque les utilisateurs y accéderont réellement ?
A : Le court terme n'équivaut pas à un hébergement parallèle à long terme de tous les anciens modèles ; Anthropic a déclaré qu'en raison de contraintes de coût et de complexité, elle étudie la possibilité de maintenir une disponibilité limitée pour un petit nombre de modèles retirés lorsque les conditions le permettent, et de fournir des conseils de migration et une notification préalable.
Q : Quel est le lien entre cela et les politiques de retraite existantes ?
A : Cet engagement constitue un nouveau mécanisme de préservation et d'enregistrement qui, associé aux préavis de mise hors service, aux suggestions de migration et aux calendriers publiés par les plateformes coopératives (telles que les plateformes cloud et les intégrateurs), permettra de réduire les interruptions causées par la mise hors service.