2025年11月、OpenAIは公式ウェブサイトで声明を発表し、著作権訴訟におけるニューヨーク・タイムズの証拠収集要求を「一線を越えた」と名付け、相手は約2,000万件のChatGPTユーザー会話を取得して、ユーザーがこのモデルを使用してニューヨーク・タイムズのペイウォールを迂回し、レポートの内容をコピーしたかどうかを調べたいと述べた。 OpenAIは、これらのチャットにはパスワード、支払い情報、健康上の問題、精神的苦痛などの非常に機密性の高いコンテンツが含まれており、第三者の弁護士チームへの大規模な転送はユーザーのプライバシーに対するプラットフォームの取り組みに抵触するため、同社は法廷でこの要求を阻止するために最善を尽くすと強調した。
この紛争は、2023年後半にニューヨーク・タイムズ紙が起こした著作権訴訟に端を発しており、OpenAIとマイクロソフトがタイムズ紙のコンテンツを悪用して無断でモデルをトレーニングし、その結果、オリジナルと非常によく似た出力がいくつか出たという主な主張がある。 訴訟が進むにつれて、トレーニングデータが合法かどうかから「証拠をどの程度、どのように入手できるか」に徐々に焦点が移っていきました。 一部の裁判所は、証拠収集のための一部の会話ログへのアクセス制限は、厳格な機密保持命令と匿名化措置の下で議論可能であるとの判決を下しており、ニューヨーク・タイムズは、このデータを特定のユーザーを特定するために使用しないと主張しています。 OpenAIは、たとえ名前やアカウントが削除されたとしても、コンテンツ自体が個人の身元やプライバシーを暴露するのに十分である可能性があると強調し、著作権の主張とユーザーデータのセキュリティのバランスをより抑制するよう裁判所に求めた。
これに関連して、OpenAIは過去に、関連するチャット記録の削除を通常どおり一時停止し、一元的に保管するよう求められる、より広範な証拠保存命令を受けており、その後、同社は控訴や交渉を通じて特定の期間のデータの法的保存義務を軽減し、トレーニングや製品改善には使用しないことを約束しました。 将来的には、裁判所がチャット記録の開示範囲をどのように描写するかは、この訴訟の結果に影響を与えるだけでなく、プラットフォームAIサービス全体がログの保持、プライバシー保護、訴訟証拠の収集をどのようにトレードオフするかを示すデモンストレーションの境界を提供することになる。
よくある質問Q
: ニューヨーク・タイムズ紙が OpenAI に 2,000 万件のチャット ログを要求するのはなぜですか?
A: ニューヨーク・タイムズ紙は、これらのChatGPTの会話の中で、ユーザーがこのモデルを使用してタイムズ紙の有料コンテンツを復元または再構築したという証拠を見つけ、それによって著作権訴訟における証拠発見戦略である「このモデルは著作権で保護された作品を大量に複製する」という主張を裏付けたいと考えています。
Q: OpenAI はこのフォレンジック要求にどのようなリスクがあると考えていますか?
A: OpenAIは、アカウント情報や名前を削除したとしても、チャットコンテンツ自体には病気、仕事、家族、経済などの詳細が含まれており、間接的に当事者を特定するのに十分であり、このデータを相手の法務チームに大規模に転送すると重大なプライバシーリスクが生じるため、これをユーザーのプライバシーに対する「侵害」と呼んでいます。
Q: チャット記録に対する裁判所の現在の態度は何ですか?
A: 一方で、裁判所はOpenAIに関連ログの削除の停止を求める証拠保存命令を出しましたが、他方では、その後の判決では、保護命令の枠組み内での限られた証拠収集のみを許可し、ニューヨークタイムズが要求されたすべてのデータを取得することを直接サポートしませんでした。
Q: 一般ユーザーの ChatGPT 会話は長期間保存されますか?
A: OpenAI の公式声明では、通常の状況では、ユーザーが会話を削除した後、関連するコンテンツは一定期間内にシステムから削除され、トレーニングに使用されなくなります。 しかし、ニューヨーク・タイムズ紙の訴訟では、一部の期間は裁判所命令の対象となり、訴訟が終了するまで法的保留システムに保管する必要がありました。 データ保持契約がゼロの企業およびユーザーは、通常、この紛争の対象外です。
Q: この事件は AI 業界全体にどのような影響を与える可能性がありますか?
A: 訴訟の結果は、ニュースコンテンツがトレーニングデータの公正な使用とみなされるかどうかに関係するだけでなく、将来の訴訟におけるプラットフォームのチャット記録の証拠価値を裁判所がどのように見ているかにも影響します。 AI企業は、ログ保持ポリシー、削除メカニズム、アウトバウンド配信プロセスを設計する際に、将来直面する可能性のある同様の要件を考慮する必要があり、業界は「データの最小化」と「法令遵守」の境界のバランスを再調整する必要になります。