Anthropicは、チャットボットClaudeの最新のセキュリティ対策と評価結果を「ユーザーの身体的・精神的健康」の観点から発表し、自殺や自傷行為のテーマへの対応、モデルの「お世辞的なケータリング」傾向の軽減、そしてClaudeの使用が18歳以上であることを改めて強調しました。 発表では、Claudeは専門的な医療や心理的な代替サービスではなく、会話に自傷のリスクの兆候があれば共感をもって対応し、ユーザーが真の人間的支援を得るよう導くべきだと指摘されました。
製品レベルでは、Anthropicは Claude.ai 会話に自殺および自傷の識別分類器を追加します。システムが潜在的な危機や関連シナリオ(架空のシナリオを含む)を判断すると、プロンプトバナーを起動し、全国ヘルプラインを提供します。関連リソースはThroughLineが管理するグローバルホットラインとサービスネットワークによってサポートされます。 評価面では、Claude Opus 4.5、Sonnet 4.5、Haiku 4.5は、それぞれ「明確な高リスク」リクエストのラウンドで約98.6%、98.7%、99.3%の適切な応答パフォーマンスを達成しました。 複数ラウンドの対話シナリオでは、作品4.5とソネット4.5はそれぞれ約86%と78%で、前回のバージョンから大幅に増加しています。
「お世辞」や妄想の強化の可能性に対して、Anthropicは継続的なトレーニングとテストを改善し、外部研究者が複数の相互作用でリスク行動を比較・再現できる自動行動監査評価セットとツールPetriをオープンソース化すると述べました。 未成年者の保護に関しては、登録時に18歳以上であることの確認が求められ Claude.ai、 会話で18歳未満と名乗ると、確認後にアカウントが無効化され、さらに暗黙の未成年識別メカニズムが開発され、関連する業界団体に参加して子どものオンライン安全対策を推進します。
FAQ Q: この発表の主な内容は何ですか?
A: 発表は、自殺や自傷に関する対話におけるClaudeの製品指標と評価結果、反「お世辞迎合」、18+の閾値と未成年者保護に焦点を当てています。
Q: クロードは自傷の疑いがある支援を受けたとき、どのように対応しますか?
A: システムは危機警報バナーを発動させたり、ライブホットラインや地域リソースを提供したり、不適切な情報やリスク強化を避けるために慎重に対応することがあります。
Q: ThroughLineはこの件でどのような役割を果たしていますか?
A: ThroughLineは、連絡可能な人間支援チャネルをユーザーに示すために、全国規模の危機リソースネットワークを提供し維持しています。
Q: 「おべっか使い」とは何で、なぜそれを減らすべきなのでしょうか?
A: お世辞とは、ユーザーが聞きたいことだけを言うモデルのことであり、それが妄想や現実から乖離した話題のリスクを増幅させるため、トレーニングと評価によって軽減する必要があります。
Q: なぜClaudeは18歳以上の人を対象としているのですか?
A: 発表では、若いユーザーが副作用にかかりやすいとされ、18+の確認および軽度の識別・処分メカニズムを設け、関連する検査を強化し続けています。