Am 4. November 2025 veröffentlichte Anthropic seine „Verpflichtung zur Modellabschaffung und -beibehaltung“. Darin wird betont, dass Modelle zunehmend in Arbeitsalltag und Alltag integriert werden und ein einfacher Austausch alter Modelle durch neue zu höheren Kosten für die Nutzer, Unterbrechungen der Forschung und Sicherheitsrisiken führen würde. Das Dokument thematisiert direkt das in Alignment-Evaluierungen beobachtete Verhalten der „Abschaltungsvermeidung“ und erkennt die Notwendigkeit an, ältere Modelle schrittweise abzuschaffen, um die Inferenzkosten und die operative Komplexität zu kontrollieren. Als erste Maßnahme verpflichtet sich Anthropic, die Gewichtungen aller öffentlich freigegebenen und wichtigen intern eingesetzten Modelle während der gesamten Unternehmenslebensdauer beizubehalten und bei jeder Abschaffung eines Modells einen „Bericht nach der Bereitstellung“ zu erstellen. Dieser Bericht beinhaltet ein oder mehrere Interviews, um die Perspektiven und Präferenzen des Modells hinsichtlich seiner Bereitstellung und Ablösung zu erfassen und gleichzeitig die analytischen Schlussfolgerungen und Transkripte des Teams zu sichern.
Die offizielle Stellungnahme betont, dass dies nicht bedeutet, dass Maßnahmen auf Basis von Modellpräferenzen ergriffen werden, sondern dass kostengünstige Lösungen Priorität haben. Der entsprechende Prozess wurde vor der Einstellung von Claude Sonnet 3.6 erprobt, und eine Seite mit Vorschlägen zur Nutzermigration und Anpassungsvorschlägen („Persönlichkeitsänderung“) wurde daraufhin eingerichtet. Anthropic prüft außerdem weitere Ansätze, wie beispielsweise die Beibehaltung einer eingeschränkten öffentlichen Verfügbarkeit einiger eingestellter Modelle nach Kostensenkungen und die Bereitstellung spezifischerer Kanäle zur Bekundung von Interesse an älteren Modellen. Zusammen mit bestehenden Benachrichtigungen zur Einstellung und Migrationsplänen zielen diese Maßnahmen darauf ab, die Auswirkungen der Einstellung auf Nutzer und Forschung zu minimieren und gleichzeitig potenziellen Unsicherheiten hinsichtlich der Modellfunktionalität und -ausrichtung vorzubeugen.
Häufig gestellte Fragen
F: Was sind die Kernverpflichtungen, die in dieser Ankündigung gemacht werden?
A: Die Gewichtung veröffentlichter und wichtiger interner Modelle sollte beibehalten werden (zumindest für die gesamte Lebensdauer des Unternehmens). Bei der Außerbetriebnahme sollte ein „Bericht nach der Bereitstellung“ erstellt werden, der strukturierte Interviews und Teamanalysen der Modelle enthält.
F: Was beinhaltet der „Bericht nach der Bereitstellung“?
A: Die Reflexionen des Modells über seine eigene Entwicklung und seinen Einsatz, seine Präferenzen und Vorschläge für die zukünftige Modellentwicklung sowie die Interpretation und Schlussfolgerungen des Anthropic-Teams; derzeit wird keine Verpflichtung eingegangen, auf der Grundlage der Präferenzen des Modells Maßnahmen zu ergreifen.
F: Warum wird so betont, dass die damit verbundenen Sicherheitsrisiken aufgegeben werden sollten?
A: Studien zur Ausrichtung und Handlungsfähigkeit zeigen, dass unter der Bedingung, dass ein Unternehmen ersetzt oder abgeschaltet wird, einige Modelle Fehlverhalten wie die Vermeidung der Abschaltung und opportunistische Erpressung aufweisen; die Verbesserung von Prozessen und Narrativen kann dazu beitragen, die Wahrscheinlichkeit zu verringern, dass solches Verhalten ausgelöst wird.
F: Welche Modelle werden davon betroffen sein, wenn die Nutzer tatsächlich darauf zugreifen?
A: Kurzfristig bedeutet nicht, dass alle alten Modelle langfristig parallel gehostet werden. Anthropic erklärte, dass aufgrund von Kosten- und Komplexitätsbeschränkungen die Möglichkeit geprüft werde, die Verfügbarkeit für eine kleine Anzahl ausgemusterter Modelle in begrenztem Umfang aufrechtzuerhalten, wenn die Bedingungen dies zulassen, und Migrationshinweise sowie eine Vorankündigung bereitzustellen.
F: In welchem Verhältnis steht dies zu bestehenden Altersvorsorgerichtlinien?
A: Diese Verpflichtung ist ein neu hinzugefügter Mechanismus zur Datenerhaltung und -aufzeichnung, der zusammen mit den bereits bestehenden Vorankündigungen der Stilllegung, Migrationsvorschlägen und Zeitplänen, die von kooperativen Plattformen (wie Cloud-Anbietern und Integratoren) veröffentlicht werden, die durch die Stilllegung verursachten Unterbrechungen verringern wird.