Zurück zu KI-Informationen
OpenAI kündigt Verbesserungen bei der Sicherheit vertraulicher Gespräche an: Die Zusammenarbeit mit über 170 Experten reduziert unangemessene Antworten um 65–80 %

OpenAI kündigt Verbesserungen bei der Sicherheit vertraulicher Gespräche an: Die Zusammenarbeit mit über 170 Experten reduziert unangemessene Antworten um 65–80 %

KI-Informationen Admin 110 Aufrufe

OpenAI veröffentlichte die Studie „Stärkung der ChatGPT-Reaktionen in sensiblen Gesprächen“ und gab bekannt, dass das Unternehmen mit über 170 klinisch erfahrenen Experten für psychische Gesundheit zusammengearbeitet hat, um das Standardmodell von ChatGPT zu aktualisieren. Dadurch sollen Signale, die auf Hilfesuche hinweisen, zuverlässiger erkannt, Gespräche deeskaliert und Nutzer zu realer Unterstützung geführt werden. Laut Messungen im Dokument gingen Reaktionen mit unerwünschtem Verhalten in psychischen Bereichen um etwa 65–80 % zurück. Das Unternehmen erweiterte außerdem die Abdeckung seiner Krisenhotline, leitete sensible Gespräche von anderen Modellen auf sicherere um und fügte sanfte Erinnerungen hinzu, bei langen Gesprächen eine Pause einzulegen.

Dieses Update konzentriert sich auf drei Szenarien: schwere Symptome wie Psychose/Manie, Selbstverletzung und Suizid sowie emotionale Abhängigkeit von KI. OpenAI hat außerdem die Modellspezifikation aktualisiert, um klarzustellen, dass Modelle die Verstärkung unbegründeter Überzeugungen vermeiden, reale zwischenmenschliche Beziehungen respektieren und indirekten Anzeichen von Selbstverletzung und Suizid stärker Rechnung tragen sollten. Zusätzlich zu den bestehenden Baselines für Selbstverletzung und Suizid werden künftig auch „emotionale Abhängigkeit“ und „nicht-suizidale psychische Notfälle“ in die standardisierten Baseline-Tests für zukünftige Modellversionen einbezogen.

Häufig gestellte Fragen

F: Wo genau spiegeln sich diese Änderungen wider?

A: Aktualisiertes Standardmodellverhalten, automatische Umleitung vertraulicher Gespräche, umfassendere Links zur Krisenhotline und „Pausenerinnerungen“ für lange Gespräche.

F: Um welche vorrangigen Szenarien handelt es sich?

A: Akute Symptome wie Psychose/Manie, Selbstverletzungs- und Suizidgefahr sowie übermäßige emotionale Abhängigkeit vom Modell.

F: Wie kann man den Effekt quantifizieren?

A: Offizielle Stellen gaben an, dass unangemessene Reaktionen in entsprechenden Bereichen um 65 bis 80 % zurückgegangen seien und die Zuverlässigkeit bei anspruchsvollen Sicherheitsbewertungen mit langen Dialogen bei über 95 % geblieben sei.

F: Haben sich die Sicherheitsprinzipien geändert?

A: Machen Sie bestehende Ziele in der Modellspezifikation deutlicher, z. B. das Nichtbestätigen unbegründeter Überzeugungen und das Achten auf indirekte Anzeichen von Selbstverletzung oder Selbstmord.

F: Wie wird das neue Modell in Zukunft bewertet?

A: Fügen Sie dem Basistest „emotionale Abhängigkeit“ und „nicht-suizidale Notfälle“ als Teil der Entlassungsschwelle zusammen mit der Basislinie für Selbstverletzung und Suizid hinzu.

ChatGPT-sensible Gespräche ChatGPT-Update zur psychischen Gesundheit ChatGPT-Kriseninterventionsfunktionen ChatGPT Selbstverletzung und Selbstmorderkennung ChatGPT-Leitfaden zur emotionalen Abhängigkeit ChatGPT-Ruheerinnerung ChatGPT-Umleitungssicherheitsmodell ChatGPT-Sicherheit für lange Sitzungen Erweiterung der ChatGPT-Hotline-Abdeckung ChatGPT-Standardmodell-Upgrade OpenAI-Sicherheitsupdate 2025 OpenAI-Zusammenarbeit im Bereich psychische Gesundheit OpenAI ModelSpec-Update OpenAI-Sicherheits-Baseline-Test OpenAI-Psychose-Szenario OpenAI-Manie-Symptomerkennung OpenAIs unangemessene Antworten sinken OpenAI-Evaluierung hoher Zuverlässigkeit OpenAI-Richtlinien für vertrauliche Gespräche OpenAI Reality-Supporthandbuch ChatGPT – Zusammenarbeit mit klinischen Experten ChatGPT65_80 verringern ChatGPT95-Zuverlässigkeit ChatGPT-Hilfesignalerkennung ChatGPT-Strategie für moderierte Konversationen ChatGPT-Krisenhotline-Link ChatGPT-Standardverhaltensoptimierung Verfeinerung des ChatGPT-Sicherheitsprinzips ChatGPT signalisiert indirekt Aufmerksamkeit ChatGPT schwieriges langes Gespräch OpenAI-Basislinie zur emotionalen Abhängigkeit OpenAI Nicht-suizidaler Notfall OpenAI verschärft die Freigabeschwelle Sicherer Umleitungsmechanismus von OpenAI Regionale Erweiterung der OpenAI-Hotline OpenAI-Benutzersupportpfad ChatGPT-Reaktion auf Suizidrisiko ChatGPT-Code für psychische Gesundheit ChatGPT zwischenmenschliche Beziehung Respekt ChatGPT-Glaube wird nicht gestärkt Sicheres Routing im ChatGPT-Modell Sicheres ChatGPT-Routing OpenAI-Integration von Krisenressourcen Ethik und Compliance bei OpenAI ChatGPT-Abdeckung sensibler Szenen ChatGPT-Modellwechselstrategie OpenAI-Krisenhotline wird erweitert ChatGPT lange Gespräche empfehlen eine Pause ChatGPTModelSpec-Details ChatGPT-Support in der Praxis

Empfohlene Tools

Mehr