mer. Juin 24th, 2026

Mis à jour le 14 janvier 2025 à 16h27, heure de l’Est

Un groupe d’organisations de presse, dirigé par The New York Times, a assigné en justice OpenAI, le créateur de ChatGPT, devant un tribunal fédéral ce mardi. Ce procès pourrait déterminer si la société technologique devra faire face aux éditeurs dans une affaire très médiatisée de violation de droits d’auteur.

Les poursuites de trois éditeurs contre OpenAI et son investisseur principal, Microsoft, ont été regroupées en une seule affaire. Les plaignants sont The New York Times, The New York Daily News et le Center for Investigative Reporting.

D’autres éditeurs, tels que l’Associated Press, News Corp. et Vox Media, ont négocié des accords de partage de contenu avec OpenAI. En revanche, les trois plaignants de cette affaire adoptent une approche offensive.

La séance de mardi était centrée sur la demande de rejet d’OpenAI, une étape cruciale où un juge doit décider si l’affaire peut aller jusqu’au procès ou être classée.

Les plaignants soutiennent que les données alimentant ChatGPT contiennent des millions d’œuvres protégées par des droits d’auteur provenant de leurs organisations, des articles utilisés sans consentement ni rémunération, constituant ainsi, selon eux, une violation massive des droits d’auteur.

“Nous devons suivre les données”, a déclaré l’avocate du Times, Jennifer Maisel, au tribunal. “Tout comme on suit l’argent dans les affaires criminelles.”

Les avocats des éditeurs soutiennent que ChatGPT et Microsoft tirent profit d’un travail journalistique qui a été scanné, traité et reproduit sans paiement ni consentement. Microsoft a intégré la technologie d’OpenAI dans son moteur de recherche, Bing.

“C’est un substitut”, a affirmé l’avocat du Times, Ian Crosby, signifiant que ChatGPT et Bing sont devenus, pour certains, une alternative à l’œuvre originale des éditeurs. Ce point, s’il est prouvé, pourrait être crucial pour gagner une affaire de violation de droits d’auteur.

Dans des documents juridiques, Crosby a précisé que l’utilisation illégale par OpenAI du travail du Times pour créer des produits d’intelligence artificielle concurrents menace la capacité du Times à fournir ce service.

OpenAI soutient que l’énorme volume de données utilisé pour entraîner son chatbot d’intelligence artificielle est protégé par les règles de “fair use”. Il s’agit d’un principe du droit américain permettant l’utilisation de matériel protégé pour des fins éducatives, de recherche ou de commentaire.

Pour répondre aux critères de l’exception de “fair use”, l’œuvre concernée doit avoir transformé la création originale en quelque chose de nouveau, sans rivaliser avec l’original sur le même marché, entre autres facteurs.

Pour prouver que leur utilisation du texte est transformative, l’équipe juridique d’OpenAI et de Microsoft a expliqué au juge Sidney Stein, nommé par le président Bill Clinton, comment fonctionnent les modèles de langage de grande taille, comme ChatGPT.

Les avocats des sociétés ont déclaré que lorsque les modèles d’intelligence artificielle d’OpenAI sont alimentés en données, celles-ci sont triées en une série de “tokens”, des unités facilitant l’analyse des données. Progressivement, le modèle peut reconnaître des schémas.

Joseph Gratz, avocat d’OpenAI, a précisé que reproduire des articles entiers “n’est pas ce pour quoi il a été conçu”.

“Ce n’est pas un système de récupération de documents. C’est un modèle de langage de grande taille,” a affirmé Gratz.

Selon lui, les exemples de violation cités par le Times dans la plainte n’auraient pu se produire qu’après “des milliers voire des dizaines de milliers” de requêtes. Autrement dit, les éditeurs auraient préparé le chatbot à fournir du texte provenant de leurs sites web.

Microsoft invoque la puissance du Times pour défier la technologie menaçante

Dans leur motion de rejet, les avocats de Microsoft, le plus grand investisseur d’OpenAI, ont déclaré qu’il n’était pas illégal pour OpenAI d’ingérer ce texte journalistique.

“Dans cette affaire, The New York Times utilise sa puissance et son porte-voix pour défier la dernière avancée technologique majeure : le modèle de langage de grande taille, ou LLM,” ont-ils écrit dans le dossier judiciaire, faisant référence à la technologie qui sous-tend ChatGPT. “Malgré les affirmations du Times, le droit d’auteur n’est pas plus un obstacle au LLM qu’il ne l’était pour le VCR (ou le piano à rouleaux, la photocopieuse, l’ordinateur personnel, Internet ou le moteur de recherche).”

Cependant, les organisations de presse soutiennent que le succès mondial de ChatGPT repose en partie sur l’aspiration de grandes quantités d’articles protégés par des droits d’auteur et que ChatGPT constitue désormais un concurrent en tant que source d’informations fiables.

Cela faisait partie des arguments présentés au tribunal mardi, lorsque l’un des aspects du fonctionnement de ChatGPT a été débattu. On l’appelle “génération augmentée par la récupération”. En termes simples : il intègre des informations actualisées et plus spécifiques du web dans les réponses du chatbot.

Bien que certaines de ces informations, comme de larges extraits d’articles de presse, n’aient pas nécessairement fait partie des données d’entraînement du chatbot, elles peuvent quand même apparaître dans les sorties de ChatGPT.

Steven Lieberman, avocat du The New York Daily News, a déclaré : “Cela permet de profiter du travail des autres,” faisant référence aux lecteurs qui se tournent vers les recréations des articles de journaux par OpenAI plutôt que de consulter le site des éditeurs.

Quelles pourraient être les prochaines étapes ?

Selon la plainte déposée par le Times, OpenAI devrait être tenu responsable de milliards de dollars de dommages-intérêts en raison de la copie illégale et de l’utilisation de l’archive de ce journal. La poursuite exige également la destruction de l’ensemble de données de ChatGPT.

Une issue aussi radicale serait déterminante. Si les éditeurs remportent le procès et qu’un juge fédéral ordonne la destruction des données, cela pourrait bouleverser complètement l’entreprise, contraignant OpenAI à recréer son ensemble de données uniquement à partir d’œuvres qu’il est autorisé à utiliser.

Le droit d’auteur américain comporte également de lourdes pénalités financières, les contrevenants risquant des amendes pouvant aller jusqu’à 150 000 dollars pour chaque violation “commise de manière intentionnelle”.

“Si vous copiez des millions d’œuvres, vous pouvez voir comment cela devient un montant potentiellement fatal pour une entreprise,” a déclaré Daniel Gervais, co-directeur du programme de propriété intellectuelle à l’Université Vanderbilt, qui étudie l’IA générative, dans une interview en août 2023, lorsque le Times envisageait d’intenter une action en justice contre OpenAI avant de déposer sa plainte en décembre. “La loi sur le droit d’auteur est une épée qui planera au-dessus des entreprises d’IA pendant plusieurs années, à moins qu’elles ne trouvent une solution de négociation.”

Article original rédigé par : NPR

Points à retenir

  • La plainte des éditeurs vise à prouver que les données utilisées pour entraîner ChatGPT incluent des œuvres protégées.
  • OpenAI soutient que l’utilisation de ces données relève du “fair use”, mais les éditeurs contestent cette affirmation.
  • Le résultat de cette affaire pourrait avoir des conséquences majeures pour l’industrie de l’IA et les médias.

Le débat sur l’utilisation des données protégées dans le développement de l’intelligence artificielle soulève des questions cruciales sur l’équilibre à trouver entre innovation technologique et respect des droits d’auteur. Comment les entreprises peuvent-elles innover tout en évitant de compromettre le travail des créateurs ? La recherche d’une solution durable nécessitera un dialogue constructif entre les différents acteurs de la sphère médiatique et technologique.


Partager : X Facebook WhatsApp LinkedIn Reddit

By Maria Rodriguez

Maria est Journaliste Trilingue indépendante depuis 2015, elle intervient sur LesNews Le Web est à nous dans les univers : International, Economie, Politique, Culture et d'autres faits de Société

2 thoughts on “Le New York Times attaque OpenAI : l’avenir de ChatGPT en jeu !”
  1. Ce procès met en lumière l’importance cruciale de protéger le travail des journalistes dans cette ère numérique, où le respect des droits d’auteur ne doit jamais être négligé.

  2. Ce procès entre journalistes et innovation technologique est fascinant. Il soulève des questions essentielles sur la créativité et le respect des droits d’auteur dans notre monde digital.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *