2025년 11월, OpenAI는 공식 웹사이트를 통해 저작권 소송에서 뉴욕 타임즈의 증거 수집 요청을 "선을 넘었다"고 지목하면서 상대방이 약 2천만 건의 ChatGPT 사용자 대화를 확보하여 사용자가 뉴욕 타임스 페이월을 우회하고 보고서 내용을 복사하기 위해 모델을 사용했는지 여부를 알아내기를 원한다고 밝혔습니다. OpenAI는 이러한 채팅에는 비밀번호, 결제 정보, 건강 문제, 정서적 고통 등 매우 민감한 콘텐츠가 포함되어 있으며, 제3자 변호사 팀에 대한 대규모 전송은 사용자 개인 정보 보호에 대한 플랫폼의 약속에 위배되므로 회사는 법정에서 이러한 요청을 차단하기 위해 최선을 다할 것이라고 강조했습니다.
이 분쟁은 2023년 말 뉴욕타임스가 제기한 저작권 소송에서 비롯되었으며, OpenAI와 마이크로소프트가 타임즈 콘텐츠를 악용하여 승인 없이 모델을 훈련하여 일부 출력이 원본과 매우 유사하다는 핵심 주장이 제기되었습니다. 소송이 진행됨에 따라 학습 데이터가 합법적인지 여부에서 점차 "증거를 어떻게 그리고 어느 정도 얻을 수 있는지"로 초점이 옮겨갔습니다. 일부 법원은 증거 수집을 위해 일부 대화 기록에 대한 제한된 접근은 엄격한 기밀 유지 명령과 비식별화 조치에 따라 논의할 수 있다고 판결했으며, 뉴욕 타임즈는 이 데이터를 특정 사용자를 식별하는 데 사용하지 않을 것이라고 주장합니다. OpenAI는 이름과 계정을 삭제하더라도 콘텐츠 자체가 개인 신원과 사생활을 노출하기에 충분할 수 있다고 강조해 법원에 저작권 주장과 사용자 데이터 보안의 균형을 더욱 자제해 줄 것을 요청했습니다.
이러한 맥락에서 OpenAI는 과거에 관련 채팅 기록의 삭제를 평소와 같이 중단하고 중앙에 보관해야 하는 등 광범위한 증거 보존 명령을 받은 적이 있으며, 이후 회사는 항소 및 협상을 통해 특정 기간 동안 데이터를 법적 보존 의무를 줄이고 교육이나 제품 개선에 사용하지 않겠다고 약속했습니다. 앞으로 법원이 채팅 기록 공개 범위를 어떻게 구분하는지는 이 사건의 결과에 영향을 미칠 뿐만 아니라 전체 플랫폼 AI 서비스가 로그 보존, 개인 정보 보호 및 소송 증거 수집을 어떻게 절충하는지에 대한 시연 경계를 제공할 것입니다.
자주 묻는 질문Q
: New York Times가 OpenAI에 2천만 개의 채팅 로그를 요청하는 이유는 무엇입니까?
A: 뉴욕 타임즈는 이러한 ChatGPT 대화에서 사용자가 이 모델을 사용하여 타임즈의 유료 콘텐츠를 복원하거나 재구성했다는 증거를 찾아 저작권 소송의 증거 발견 전략인 "모델이 저작권이 있는 저작물을 대량으로 복제한다"는 주장을 뒷받침하고자 합니다.
Q: OpenAI는 이 포렌식 요청을 어떤 위험으로 간주합니까?
A: OpenAI는 계정 정보와 이름을 삭제하더라도 채팅 콘텐츠 자체에 질병, 직장, 가족, 재정 등과 같은 세부 정보가 포함되어 있어 당사자를 간접적으로 식별하기에 충분하며, 이 데이터를 상대방 법무팀에 대규모로 전송하면 심각한 개인 정보 보호 위험이 발생하므로 이를 사용자 개인 정보 보호에 대한 "침해"라고 부릅니다.
Q: 채팅 기록에 대한 법원의 현재 태도는 어떻습니까?
A: 한편 법원은 OpenAI에 관련 로그 삭제를 중단하도록 요구하는 증거 보존 명령을 내렸고, 다른 한편으로는 후속 판결에서 보호 명령의 틀 내에서 제한된 증거 수집만 허용했으며 뉴욕 타임즈가 요청한 모든 데이터를 얻도록 직접적으로 지원하지 않았습니다.
Q: 일반 사용자의 ChatGPT 대화는 오랫동안 저장되나요?
A: OpenAI의 공개 성명은 정상적인 상황에서 사용자가 대화를 삭제한 후 관련 콘텐츠가 일정 기간 내에 시스템에서 제거되고 더 이상 교육에 사용되지 않는다는 것입니다. 그러나 뉴욕타임스 소송 기간 중 일부는 법원 명령의 대상이 되어 절차가 끝날 때까지 법적 보류 시스템에 보관되어야 했습니다. 데이터 보존 계약이 없는 기업 및 사용자는 일반적으로 이 분쟁의 적용을 받지 않습니다.
Q: 이 사건이 AI 산업 전체에 미칠 수 있는 잠재적 영향은 무엇입니까?
A: 사건의 결과는 뉴스 콘텐츠가 교육 데이터의 공정한 사용으로 간주될 수 있는지 여부와 관련이 있을 뿐만 아니라 향후 소송에서 법원이 플랫폼 채팅 기록의 증거 가치를 어떻게 보는지에 영향을 미칩니다. AI 기업은 로그 보존 정책, 삭제 메커니즘 및 아웃바운드 전달 프로세스를 설계할 때 미래에 직면할 수 있는 유사한 요구 사항을 고려해야 하며, 이로 인해 업계는 "데이터 최소화"와 "법률 준수" 사이의 경계를 재조정해야 합니다.