En novembre 2025, OpenAI a publié une déclaration sur son site officiel, qualifiant la demande de collecte de preuves du New York Times dans le procès pour droits d’auteur de « franchissant la ligne », affirmant que l’autre partie souhaitait obtenir environ 20 millions de conversations d’utilisateurs de ChatGPT pour savoir si les utilisateurs utilisaient le modèle pour contourner le mur payant du New York Times et copier le contenu du rapport. OpenAI a souligné que ces chats contiennent du contenu très sensible tel que des mots de passe, des informations de paiement, des problèmes de santé et de la détresse émotionnelle, et que tout transfert à grande échelle à une équipe d’avocats tiers entre en conflit avec l’engagement de la plateforme envers la confidentialité des utilisateurs, de sorte que la société fera tout son possible pour bloquer cette demande devant les tribunaux.
Le différend découle d’une action en justice pour droits d’auteur intentée par le New York Times fin 2023, avec des allégations fondamentales selon lesquelles OpenAI et Microsoft ont exploité le contenu du Times pour entraîner des modèles sans autorisation, ce qui a donné lieu à des sorties qui ressemblent beaucoup à l’original. Au fur et à mesure que le procès progressait, l’accent a progressivement été mis sur la légalité des données d’entraînement et sur « comment et dans quelle mesure les preuves peuvent être obtenues ». Certains tribunaux ont statué que l’accès limité à certains des journaux de conversation pour la collecte de preuves peut être discuté en vertu d’ordonnances de confidentialité strictes et de mesures de dépersonnalisation, et le New York Times affirme qu’il n’utilisera pas ces données pour identifier des utilisateurs spécifiques. OpenAI a souligné que même si les noms et les comptes sont supprimés, le contenu lui-même peut suffire à exposer l’identité personnelle et la vie privée, elle a donc demandé au tribunal d’être plus modéré dans l’équilibre entre les revendications de droits d’auteur et la sécurité des données des utilisateurs.
Dans ce contexte, OpenAI a reçu des ordonnances de conservation de preuves plus larges dans le passé, étant tenu de suspendre la suppression des enregistrements de chat pertinents comme d’habitude et de les conserver de manière centralisée, puis la société a réduit son obligation de conservation légale des données pendant une période de temps spécifique par le biais d’appels et de négociations, et a promis de ne pas les utiliser pour la formation ou l’amélioration des produits. À l’avenir, la façon dont le tribunal délimitera la portée de la divulgation des enregistrements de chat affectera non seulement l’issue de cette affaire, mais fournira également une limite de démonstration de la façon dont l’ensemble du service d’IA de la plateforme négocie la conservation des journaux, la protection de la vie privée et la collecte de preuves en cas de litige.
FAQsQ
: Pourquoi le New York Times demande-t-il à OpenAI 20 millions de journaux de chat ?
R : Le New York Times veut trouver des preuves dans ces conversations ChatGPT que les utilisateurs ont utilisé le modèle pour restaurer ou reconstruire le contenu payant du Times, étayant ainsi son affirmation selon laquelle « le modèle reproduit en grand nombre des œuvres protégées par le droit d’auteur », ce qui est une stratégie de découverte de preuves dans les litiges en matière de droit d’auteur.
Q : Quels sont les risques qu’OpenAI considère comme cette demande d’expertise ?
R : OpenAI estime que même si les informations du compte et le nom sont supprimés, le contenu du chat lui-même contient des détails tels que la maladie, le travail, la famille, les finances, etc., ce qui est suffisant pour que les parties soient indirectement identifiées, et le transfert à grande échelle de ces données à l’équipe juridique adverse posera de graves risques pour la vie privée, c’est pourquoi il appelle cela une « intrusion » dans la vie privée des utilisateurs.
Q : Quelle est l’attitude actuelle du tribunal à l’égard des enregistrements de chat ?
R : D’une part, le tribunal a émis une ordonnance de conservation des preuves exigeant qu’OpenAI suspende la suppression des journaux pertinents, et d’autre part, dans des décisions ultérieures, il n’a autorisé qu’une collecte limitée de preuves dans le cadre de l’ordonnance de protection, et n’a pas directement soutenu le New York Times pour obtenir toutes les données demandées.
Q : Les conversations ChatGPT des utilisateurs ordinaires seront-elles conservées pendant une longue période ?
R : La déclaration publique d’OpenAI est que, dans des circonstances normales, après qu’un utilisateur a supprimé une conversation, le contenu pertinent sera supprimé du système dans un certain délai et ne sera plus utilisé pour la formation. Cependant, lors du procès du New York Times, une partie de la période a fait l’objet d’une ordonnance du tribunal et a dû être conservée dans un système de conservation légale jusqu’à la fin de la procédure. Les entreprises et les utilisateurs sans contrat de conservation des données ne sont généralement pas couverts par ce litige.
Q : Quelles sont les implications potentielles de cette affaire pour l’industrie de l’IA dans son ensemble ?
R : L’issue de l’affaire n’est pas seulement liée à la question de savoir si le contenu des actualités peut être considéré comme une utilisation équitable des données de formation, mais affecte également la façon dont le tribunal considère la valeur probante des enregistrements de chat de la plateforme dans les litiges à l’avenir. Les entreprises d’IA devront tenir compte d’exigences similaires auxquelles elles pourraient être confrontées à l’avenir lors de la conception de politiques de conservation des journaux, de mécanismes de suppression et de processus de livraison sortante, ce qui poussera l’industrie à rééquilibrer les frontières entre la « minimisation des données » et la « conformité légale ».