戻るAI情報
OpenAI、センシティブな会話の安全性向上を発表:170人以上の専門家との連携で不適切な応答を65~80%削減

OpenAI、センシティブな会話の安全性向上を発表:170人以上の専門家との連携で不適切な応答を65~80%削減

AI情報 Admin 110 回閲覧

OpenAIは「センシティブな会話におけるChatGPTの応答強化」を発表し、170人以上の臨床経験豊富なメンタルヘルス専門家と協力し、ChatGPTのデフォルトモデルを更新することで、助けを求めるシグナルをより確実に識別し、会話をエスカレートさせず、ユーザーを現実世界でのサポートに誘導することを目指したと発表しました。論文に掲載された測定結果によると、メンタルヘルス関連分野における望ましくない行動を伴う応答は約65%~80%減少しました。また、同社は危機ホットラインの対象範囲を拡大し、センシティブな会話を他のモデルからより安全なものにリダイレクトし、長い会話中に休憩を取るよう促す穏やかなリマインダーを追加しました。

今回のアップデートは、精神病/躁病などの重篤な症状、自傷行為および自殺、そしてAIへの感情的依存という3つのシナリオに焦点を当てています。OpenAIはまた、モデル仕様を更新し、モデルは根拠のない信念の強化を避け、現実の人間関係を尊重し、自傷行為および自殺の間接的な兆候にさらに注意を払うべきであることを明確にしました。今後、自傷行為および自殺に関する既存のベースラインに加えて、「感情的依存」と「自殺を伴わない心理的緊急事態」が、将来のモデルリリースにおける標準化されたベースラインテストに含まれる予定です。

よくある質問

Q: これらの変更は具体的にどこに反映されますか?

A: デフォルトのモデル動作の更新、機密性の高い会話の自動リダイレクト、より広範な危機ホットライン リンク、長い会話の「休憩リマインダー」などです。

Q: 優先シナリオにはどのようなものがありますか?

A: 精神病/躁病などの急性症状、自傷や自殺の危険性、モデルに対する過度の感情的依存など。

Q: 効果を定量化するにはどうすればいいですか?

A: 当局は、関連分野における不適切な対応が65%~80%減少し、難易度の高い長時間対話によるセキュリティ評価の信頼性は95%以上を維持していると述べました。

Q: 安全原則は変更されましたか?

A: 根拠のない信念を肯定しないことや、自傷行為や自殺の間接的な兆候に注意を払うなど、モデル仕様で既存の目標をより明確にします。

Q: 新しいモデルは今後どのように評価されるのでしょうか?

A: 自傷行為と自殺のベースラインとともに、「感情的依存」と「非自殺的緊急事態」を解放閾値の一部としてベースライン テストに追加します。

ChatGPT の機密性の高い会話 ChatGPTメンタルヘルスアップデート ChatGPTの危機介入機能 ChatGPT自傷行為と自殺の特定 ChatGPT感情依存ガイダンス ChatGPT休憩リマインダー ChatGPTリダイレクトセキュリティモデル ChatGPTの長時間セッションセキュリティ ChatGPTホットラインの対象範囲拡大 ChatGPTデフォルトモデルのアップグレード OpenAI セキュリティアップデート 2025 OpenAIメンタルヘルスコラボレーション OpenAI ModelSpec アップデート OpenAI セキュリティ ベースライン テスト OpenAI 精神病シナリオ OpenAIによる躁病症状の認識 OpenAIの不適切な回答が減少 OpenAIの高信頼性評価 OpenAI センシティブな会話ガイドライン OpenAI Reality サポートガイド ChatGPT臨床専門家コラボレーション ChatGPT65_80 減少 ChatGPT95の信頼性 ChatGPTヘルプ信号認識 ChatGPTによるモデレートされた会話戦略 ChatGPT危機ホットラインリンク ChatGPTのデフォルト動作の最適化 ChatGPTセキュリティ原則の改良 ChatGPTは間接的に注意を喚起する ChatGPT 難しい長い会話 OpenAI 感情依存ベースライン OpenAI 非自殺的緊急事態 OpenAIがリリースの閾値を厳格化 OpenAIの安全なリダイレクトメカニズム OpenAIホットラインの地域拡大 OpenAIユーザーサポートパス ChatGPT自殺リスク対応 ChatGPTメンタルヘルスコード ChatGPT対人関係の尊重 ChatGPTの信念は強化されない ChatGPTモデルの安全なルーティング ChatGPTセキュアルーティング OpenAI危機リソース統合 OpenAIの倫理とコンプライアンス ChatGPTのセンシティブなシーンのカバー ChatGPTモデル切り替え戦略 OpenAI危機ホットラインが拡大 ChatGPTの長い会話は休憩を取ることを提案します ChatGPTモデル仕様の詳細 ChatGPT リアルワールドサポート

関連記事

Anthropic が金融業界の最新情報を発表: Excel 向け Claude、リアルタイム マーケット コネクタ、および事前構築済みの金融エージェント スキル

Anthropic が金融業界の最新情報を発表: Excel 向け Claude、リアルタイム マーケット コネクタ、および事前構築済みの金融エージェント スキル

Anthropicは、金融業界向けに複数のアップデートを発表しました。Microsoft Excelサイドバーのワークブックを読み取り、分析、変更し、セルの追跡可能性を備えた説明と変更ログを提供するC...

Manus 1.5 アップデート: 「クイックスタイルコントロール」と「プロンプトワードの一括編集」の追加により、Web ページの編集がより高速かつ安心になりました。

Manus 1.5 アップデート: 「クイックスタイルコントロール」と「プロンプトワードの一括編集」の追加により、Web ページの編集がより高速かつ安心になりました。

Manusは、Webエディタのアップグレード版1.5のリリースを発表しました。このコア変更により、従来の「編集して待つ」というプロセスが、プロンプトに基づく即時スタイルコントロールと一括処理に置き換え...

MWC上海がロボットのペナルティシュートアウトを開催:具現化された知能が公衆試験会場に移動する

MWC上海がロボットのペナルティシュートアウトを開催:具現化された知能が公衆試験会場に移動する

2026年6月1日、IT HomeはGSMAが本日、2026年6月24日から25日まで上海MWCでテーマイベントとして「ヒューマノイドロボットペナルティシュートアウト」を開催することを正式に発表したと...

CodexがWindows制御をサポートする:AIプログラミングエージェントがクロスプラットフォームコラボレーションを開始

CodexがWindows制御をサポートする:AIプログラミングエージェントがクロスプラットフォームコラボレーションを開始

2026年6月1日時点でも、OpenAIヘルプセンターのChatGPTリリースノートは最新の更新として表示されています。5月29日のエントリーには次のように記載されています:Codexは現在、Code...

おすすめツール

もっと見る