戻るAI情報
AnthropicはClaudeユーザーの身体的・精神的健康保護措置:自傷会話傍受とリソースガイダンスを公開しました

AnthropicはClaudeユーザーの身体的・精神的健康保護措置:自傷会話傍受とリソースガイダンスを公開しました

AI情報 Admin 93 回閲覧

Anthropicは、チャットボットClaudeの最新のセキュリティ対策と評価結果を「ユーザーの身体的・精神的健康」の観点から発表し、自殺や自傷行為のテーマへの対応、モデルの「お世辞的なケータリング」傾向の軽減、そしてClaudeの使用が18歳以上であることを改めて強調しました。 発表では、Claudeは専門的な医療や心理的な代替サービスではなく、会話に自傷のリスクの兆候があれば共感をもって対応し、ユーザーが真の人間的支援を得るよう導くべきだと指摘されました。


製品レベルでは、Anthropicは Claude.ai 会話に自殺および自傷の識別分類器を追加します。システムが潜在的な危機や関連シナリオ(架空のシナリオを含む)を判断すると、プロンプトバナーを起動し、全国ヘルプラインを提供します。関連リソースはThroughLineが管理するグローバルホットラインとサービスネットワークによってサポートされます。 評価面では、Claude Opus 4.5、Sonnet 4.5、Haiku 4.5は、それぞれ「明確な高リスク」リクエストのラウンドで約98.6%、98.7%、99.3%の適切な応答パフォーマンスを達成しました。 複数ラウンドの対話シナリオでは、作品4.5とソネット4.5はそれぞれ約86%と78%で、前回のバージョンから大幅に増加しています。


「お世辞」や妄想の強化の可能性に対して、Anthropicは継続的なトレーニングとテストを改善し、外部研究者が複数の相互作用でリスク行動を比較・再現できる自動行動監査評価セットとツールPetriをオープンソース化すると述べました。 未成年者の保護に関しては、登録時に18歳以上であることの確認が求められ Claude.ai、 会話で18歳未満と名乗ると、確認後にアカウントが無効化され、さらに暗黙の未成年識別メカニズムが開発され、関連する業界団体に参加して子どものオンライン安全対策を推進します。



FAQ Q: この発表の主な内容は何ですか?

A: 発表は、自殺や自傷に関する対話におけるClaudeの製品指標と評価結果、反「お世辞迎合」、18+の閾値と未成年者保護に焦点を当てています。


Q: クロードは自傷の疑いがある支援を受けたとき、どのように対応しますか?

A: システムは危機警報バナーを発動させたり、ライブホットラインや地域リソースを提供したり、不適切な情報やリスク強化を避けるために慎重に対応することがあります。


Q: ThroughLineはこの件でどのような役割を果たしていますか?

A: ThroughLineは、連絡可能な人間支援チャネルをユーザーに示すために、全国規模の危機リソースネットワークを提供し維持しています。


Q: 「おべっか使い」とは何で、なぜそれを減らすべきなのでしょうか?

A: お世辞とは、ユーザーが聞きたいことだけを言うモデルのことであり、それが妄想や現実から乖離した話題のリスクを増幅させるため、トレーニングと評価によって軽減する必要があります。


Q: なぜClaudeは18歳以上の人を対象としているのですか?

A: 発表では、若いユーザーが副作用にかかりやすいとされ、18+の確認および軽度の識別・処分メカニズムを設け、関連する検査を強化し続けています。

Anthropic Announcementがクロードの身体的・精神的健康と安全に関する新たな措置を解釈 Anthropicがクロードの自傷対処メカニズムと評価結果を発表 Anthropicはクロードの自殺と自傷の識別と支援の指導を強化します Anthropic アップグレード クロード危機バナーとグローバルホットラインリソース アンソロピックはクロードが医療の代用品ではなく、人間の支援につながると説明しています AnthropicはClaude 4を公開しています。 5. 高リスクの依頼に対する適切な応答率 Anthropicは、クロードの複数ラウンドのセリフによる自傷シーンのパフォーマンスが向上したと発表しました Anthropicは自殺と自傷の分類子プロンプトを追加 Claude.ai AnthropicはClaudeのグローバルヘルプチャンネルをサポートするためにThroughLineを導入 Anthropicは、クロードが自傷行為の兆候に対して共感的な反応を優先していることを強調しました Anthropicは、クロードが自傷行為に関する詳細な助言を避けていることを強調しました AnthropicはClaudeの安全性評価を自殺と自傷に関するトピックに焦点を当てて更新 アンソロピックは強化妄想を防ぐためにクロードのお世辞を抑えています 『Anthropic』は、クロードがおべっかりを減らす安全性の意味を説明します AnthropicのオープンソースPetriツールは、Claudeを複数回のリスク行動で監査します Anthropicが比較を再現するのに役立つペトリ評価セットを発表 Anthropicが発表 作品4.5 自傷反応率98.6% Anthropicが発表 クロード・ソネット4.5 自傷反応 98.7% Anthropicはクロード・ハイク4.5 自傷反応率99.3%を発表 Anthropicによると、Opus 4.5の複数回の危機対応は約86%です Anthropic誌によると、Sonnet 4.5は複数の危機の約78%に対応したとのことです 人類的概要 クロード4。 5. 自傷防止の安全性は旧バージョンと比べて大幅に向上しています Anthropicは、架空の自傷行為の状況も危機のきっかけを引き起こすことがあると説明しています Anthropicは製品側でバナープロンプトを使ってローカルヘルプをつなげています Anthropicは、ThroughLineがグローバルなホットラインとサービスのネットワークを維持していることを明確にしています Anthropicは、クロードがオフラインの実際の人々を高リスクに直面した際に助けるために導くべきだと強調しました アンソロピックは、クロードがカウンセリングや医療サービスを受けていないことを改めて強調しました Anthropic Reiterated Claude.ai の登録は18歳以上のユーザーに限定されています Anthropicは、18歳未満の自己申告が審査と無効化を引き起こすと述べています アンソロピックは子どもを守るために、より暗黙の未成年識別メカニズムを発展させています Anthropicは子どものオンライン安全対策を推進する業界団体に参加しています Anthropicは未成年者保護のプロセスとアカウント処分の規則を発表しました Anthropicは、18+の閾値は若いユーザーに影響しやすいと説明しています アンソロピックは共感的反応とリスク紹介をコア戦略として重視しています 『Anthropic』は、危機的対話におけるクロードのより慎重な対応スタイルを示しています Anthropicは自傷リスク識別分類器のトリガーロジックを公開します Anthropicは複数回の会話が難しくなるため、テストを継続的に改善していくと説明しています アンソロピックは、反賛辞トレーニングが妄想的な強化や迎合を減らすと主張しています Anthropicは、ペトリを使って複数の相互作用における悪行動を評価することを提案しています Anthropic Openツールは外部研究者がClaudeの安全性を監査することを可能にします Anthropic Announcement概要 自傷支援リソース表示および更新メカニズム アンソロピックはクロードの自傷の疑いの要請に応じる Anthropicは、ヘルプラインチャネルの維持におけるThroughLineの役割に答えます Anthropicは、お世辞とは何か、そしてそれがもたらす会話上のリスクに答えます Anthropicは、なぜクロードが18歳以上の人に必須条件を強調するのかの答えです Anthropicは製品指標、評価データ、セキュリティコミットメントを統合しています 人格的な考え方は、危機的な会話において危険な意図を強化しないことを強調しています アンソロピック、クロード健康安全対策および透明性報告書を発表 Anthropicは、Claudeのフルリンクセキュリティ設計を識別から紹介まで推進します

関連記事

Forceカンファレンスで発表されたDoubaoモデル1.8:コンテキスト管理はより柔軟になり、通話量の開示は1日あたり50兆元を超えています

Forceカンファレンスで発表されたDoubaoモデル1.8:コンテキスト管理はより柔軟になり、通話量の開示は1日あたり50兆元を超えています

Volcano Engineは2025年のウィンターフォースプライムパワーカンファレンスでDoubao Model 1.8を発表しました。 Volcano Engineの社長タン・ダイ氏は、新バージョ...

Mistral OCR 3が文書AIをリリース:複雑なフォームと筆跡認識で74%の勝率を主張

Mistral OCR 3が文書AIをリリース:複雑なフォームと筆跡認識で74%の勝率を主張

フランスのAI企業Mistralは、第3世代光学文字認識モデルMistral OCR 3の発売を発表し、フォーム、スキャンPDF、複雑なフォーム、手書きコンテンツなど一般的な企業シナリオをターゲットに...

MWC上海がロボットのペナルティシュートアウトを開催:具現化された知能が公衆試験会場に移動する

MWC上海がロボットのペナルティシュートアウトを開催:具現化された知能が公衆試験会場に移動する

2026年6月1日、IT HomeはGSMAが本日、2026年6月24日から25日まで上海MWCでテーマイベントとして「ヒューマノイドロボットペナルティシュートアウト」を開催することを正式に発表したと...

CodexがWindows制御をサポートする:AIプログラミングエージェントがクロスプラットフォームコラボレーションを開始

CodexがWindows制御をサポートする:AIプログラミングエージェントがクロスプラットフォームコラボレーションを開始

2026年6月1日時点でも、OpenAIヘルプセンターのChatGPTリリースノートは最新の更新として表示されています。5月29日のエントリーには次のように記載されています:Codexは現在、Code...

おすすめツール

もっと見る