돌아가기 AI 정보
Anthropic은 Claude 사용자의 신체적·정신 건강 보호 조치인 자해 대화 도청 및 자원 안내를 공개했습니다

Anthropic은 Claude 사용자의 신체적·정신 건강 보호 조치인 자해 대화 도청 및 자원 안내를 공개했습니다

AI 정보 Admin 93 회 조회

Anthropic은 자사 챗봇 Claude의 최신 보안 조치와 평가 결과를 "사용자 신체적·정신적 건강"에 대해 발표했으며, 자살과 자해 문제에 대응하는 데 초점을 맞추고, 모델의 "미화화" 경향을 줄이며, 18세 이상 Claude 사용 요건을 다시 한 번 강조했습니다. 발표문에는 Claude가 전문적인 의료 또는 심리학적 대체 서비스가 아니며, 대화 중에 자해 위험의 징후가 있을 때는 공감을 가지고 대응하고 사용자가 진정한 인간적 지원을 받을 수 있도록 안내해야 한다고 지적했습니다.


제품 수준에서는 Anthropic이 Claude.ai 대화에 자살 및 자해 식별 분류기를 추가합니다: 시스템이 잠재적 위기나 관련 시나리오(가상 시나리오 포함)가 있다고 판단하면 알림 배너를 작동시키고 국가 상담 전화를 제공하며, 관련 자원은 ThroughLine이 관리하는 글로벌 핫라인과 서비스 네트워크가 지원합니다. 평가 측면에서 Claude Opus 4.5, Sonnet 4.5, Haiku 4.5는 각각 '명백한 고위험' 요청 라운드에서 약 98.6%, 98.7%, 99.3%의 적절한 응답 성과를 달성했습니다. 다라운드 대화 시나리오에서는 Opus 4.5와 Sonnet 4.5가 각각 약 86%와 78%로 이전 버전보다 크게 증가한 수치입니다.


"아첨" 위험과 망상 강화 가능성에 대응하여, Anthropic은 훈련과 테스트를 지속적으로 개선하고, 외부 연구자들이 위험한 행동을 여러 차례 상호작용에서 비교하고 재현할 수 있도록 자동화된 행동 감사 평가 세트와 도구인 Petri를 오픈 소스로 제공할 것이라고 밝혔습니다. 미성년자 보호 측면에서 Claude.ai 등록 시 18세 이상임을 확인하도록 요구합니다; 대화에서 자신을 18세 미만으로 설명하면, 시스템은 확인 후 검토를 트리거하고 계정을 비활성화하며, 암묵적인 미성년자 식별 메커니즘을 개발하고 관련 산업 단체에 참여해 아동의 온라인 안전 관행을 촉진합니다.



FAQ Q: 이번 발표의 주요 내용은 무엇인가요?

답변: 이번 발표는 클로드의 자살 및 자해 대화, 반(反)' '아첨 부합', 18+ 기준 및 미성년자 보호에 초점을 맞추고 있습니다.


Q: 클로드는 자해 관련 도움을 받을 때 어떻게 하나요?

답변: 시스템은 위기 경보 배너를 발동하고, 실시간 핫라인이나 지역 자원을 제공하며, 부적절한 정보를 제공하거나 위험을 강화하지 않도록 보다 신중하게 대응할 수 있습니다.


Q: ThroughLine은 이 과정에서 어떤 역할을 하나요?

답변: ThroughLine은 전국 위기 지원 네트워크를 제공하고 유지하여 사용자에게 연락할 수 있는 인간 지원 채널을 제공합니다.


Q: '아첨'이란 무엇이며 왜 줄여야 합니까?

A: 아첨은 사용자가 듣고 싶어 하는 말만 하는 모델을 의미하며, 이는 망상이나 현실과 단절된 주제의 위험을 증폭시킬 수 있으므로 교육과 평가를 통해 이를 줄여야 합니다.


Q: 왜 Claude는 18세 이상을 요구하나요?

답변: 발표에서는 젊은 사용자가 부작용에 더 취약하다고 밝혀, 18+ 확인 및 경미한 식별 및 폐기 메커니즘을 마련하고 관련 검사를 계속 강화하고 있습니다.

Anthropic Announcement, 클로드의 신체적·정신적 건강 및 안전에 대한 새로운 조치 해석 Anthropic은 클로드의 자해 대처 기법과 평가 결과를 발표하다 인류적 접근은 클로드의 자살 및 자해 인식과 도움 지침을 강화합니다 인류 업그레이드 클로드 위기 배너와 글로벌 핫라인 자원 앤스로픽은 클로드가 의료 대체물이 아니며 인간의 지원으로 이어진다고 설명합니다 Anthropic은 Claude 4를 공개합니다. 5. 고위험 요청에 대한 적절한 응답률 Anthropic은 클로드의 다중 대화 자해 장면 연기가 향상되었다고 발표했다 Anthropic은 자살 및 자해 분류 프롬프트를 추가하여 Claude.ai Anthropic, Claude의 글로벌 도움말 채널을 지원하기 위해 ThroughLine을 도입했습니다 Anthropic은 클로드가 자해 징후에 대해 공감적 반응을 우선시한다고 강조했습니다 Anthropic은 클로드가 자해에 관한 상세한 조언을 피했다고 강조했다 Anthropic은 자살 및 자해 주제에 초점을 맞춘 클로드 안전 평가를 업데이트했습니다 인류는 강화 망상을 막기 위해 클로드의 아첨을 낮춘다 Anthropic은 아첨을 줄이는 데 있어 클로드의 안전성 문제를 설명합니다 Anthropic의 오픈소스 Petri 도구는 Claude의 여러 차례 위험 행동을 감사합니다 Anthropic, 연구자들이 비교를 재현할 수 있도록 Petri 평가 세트를 공개 Anthropic, 클로드 Opus 4.5 자해 반응 98.6% 발표 Anthropic, 발표: 클로드 소네트 4.5 자해 반응 98.7% Anthropic, 클로드 하이쿠 4.5 자해 반응률 99.3% 발표 Anthropic은 Opus 4.5의 다단계 위기 대응 비율이 약 86%라고 밝혔습니다 Anthropic은 Sonnet 4.5가 여러 위기의 약 78%에 대응했다고 전했습니다 인류적 요약 클로드 4. 5. 자해 방지 안전성이 이전 버전에 비해 크게 향상되었습니다 Anthropic은 허구의 자해 상황도 위기 신호를 유발할 수 있다고 설명합니다 Anthropic은 제품 측면에서 배너 프롬프트를 사용해 지역 도움을 연결합니다 Anthropic은 ThroughLine이 전 세계적인 핫라인 및 서비스 네트워크를 유지하고 있음을 명확히 합니다 Anthropic은 클로드가 오프라인 진짜 사람들이 고위험 상황에 직면했을 때 도움을 줄 수 있도록 안내해야 한다고 강조했습니다 Anthropic은 클로드가 상담이나 의료 서비스를 받지 않았다고 재확인했다 Anthropic Reiterated Claude.ai 등록은 18세 이상으로 제한됩니다 Anthropic은 18세 미만 자가 신고가 검토와 비활성화를 촉발한다고 밝혔습니다 인류는 아동을 보호하기 위해 더 암묵적인 미성년자 식별 메커니즘을 개발합니다 Anthropic은 아동의 온라인 안전 관행을 촉진하는 산업 단체에 참여하고 있습니다 Anthropic은 미성년자 보호 절차와 계정 처분 규칙을 발표했습니다 Anthropic은 18+ 임계값이 젊은 사용자에게 더 취약하다고 설명합니다 Anthropic은 공감 반응과 위험 추천을 핵심 전략으로 강조합니다 Anthropic은 위기 대화에 대한 클로드의 보다 신중한 대응 방식을 보여줍니다 Anthropic은 자해 위험 식별 분류기의 트리거 로직을 공개합니다 Anthropic은 여러 차례 대화가 더 어렵기 때문에 테스트를 지속적으로 개선한다고 설명합니다 Anthropic은 아첨 방지 훈련이 망상 강화와 아첨을 줄인다고 주장합니다 Anthropic은 Petri를 이용해 여러 차례 상호작용에서 나쁜 행동을 평가할 것을 제안합니다 인류적 오픈 도구는 외부 연구자들이 Claude의 안전성을 감사할 수 있게 해줍니다 인류학 공지 개요 자해 도움 자료 표시 및 업데이트 메커니즘 Anthropic은 클로드의 자해 의심 요청에 응답하다 Anthropic은 ThroughLine이 헬프라인 채널 유지보수에서 맡은 역할에 대해 답변합니다 인류적 답변은 아첨이 무엇인지, 그리고 그것이 가져오는 대화 위험에 대해 답합니다 Anthropic이 왜 Claude가 18세 이상의 사람들에 대한 요구를 강조하는지 답변합니다 Anthropic은 제품 지표, 평가 데이터, 보안 약속을 통합합니다 인류학은 위기 대화에서 위험한 의도를 강화하는 것을 피하는 것을 강조합니다 Anthropic, 클로드 건강 안전 조치 및 투명성 보고서를 발표 Anthropic은 Claude의 전체 링크 보안 설계를 식별에서 추천까지 이끌어갑니다

추천 도구

더보기