Mis à jour le 14 janvier 2025 à 16h27, heure de l’Est
Un groupement d’organisations de presse, mené par The New York Times, a intenté un procès contre OpenAI, le créateur de ChatGPT, devant un tribunal fédéral le mardi. Cette audience pourrait déterminer si la société technologique doit faire face à ces éditeurs dans un procès très médiatisé portant sur des violations de droits d’auteur.
Les poursuites de trois éditeurs contre OpenAI et son investisseur principal, Microsoft, ont été regroupées en une seule affaire. À la tête de ces cas, on retrouve The New York Times, The New York Daily News et le Center for Investigative Reporting.
D’autres éditeurs, comme l’Associated Press, News Corp. et Vox Media, ont conclu des accords de partage de contenu avec OpenAI, mais les trois plaignants dans cette affaire choisissent une approche offensive.
L’audience de mardi a été centrée sur la requête d’OpenAI visant à faire rejeter le procès, une étape cruciale où un juge déterminera si l’affaire peut progresser vers un procès ou si elle doit être classée sans suite.
L’argument central des éditeurs est que les données qui alimentent ChatGPT contiennent des millions d’œuvres protégées par le droit d’auteur provenant des organisations de presse, des articles utilisés sans leur consentement ni rémunération — une situation que les plaignants considèrent comme une violation massive de leurs droits d’auteur.
“Nous devons suivre les données”, a déclaré l’avocate du Times, Jennifer Maisel, lors de l’audience de mardi. “Tout comme dans les affaires criminelles où l’on suit l’argent.”
Et si l’on suit les données, l’équipe juridique des éditeurs soutient qu’OpenAI et Microsoft tirent des bénéfices de travaux journalistiques scannés, traités et reproduits sans compensation ni consentement. Microsoft a intégré la technologie d’OpenAI dans son moteur de recherche Bing.
“C’est substantiel”, a précisé l’avocat du Times, Ian Crosby, signifiant que ChatGPT et Bing sont devenus, pour certains utilisateurs, un substitut au travail original des éditeurs. Ce point, s’il est prouvé, est essentiel pour gagner un procès pour violation de droits d’auteur.
Dans des documents judiciaires, Crosby a ajouté que l’utilisation “illégale” par OpenAI du travail du Times pour créer des produits d’intelligence artificielle qui lui font concurrence menace la capacité du journal à continuer de fournir ses services.
“Utiliser la propriété intellectuelle précieuse d’autrui sans dédommagement a été extrêmement lucratif pour OpenAI”, a-t-il poursuivi.
D’un autre côté, OpenAI soutient que la grande quantité de données utilisée pour entraîner son modèle d’intelligence artificielle est protégée par les règles de “fair use”. Cette doctrine du droit américain permet d’utiliser du matériel protégé par le droit d’auteur à des fins éducatives, de recherche ou de commentaire.
Pour que l’utilisation soit considérée comme “équitable”, l’œuvre en question doit transformer l’œuvre protégée en quelque chose de nouveau, et cette nouvelle œuvre ne doit pas concurrencer l’original sur le même marché, entre autres facteurs.
Pour faire valoir que leur utilisation du texte est transformative, l’équipe juridique d’OpenAI et de Microsoft a expliqué au juge Sidney Stein, nommé par le président Bill Clinton, le fonctionnement des modèles de langage, comme ChatGPT.
Les avocats des entreprises ont expliqué que lorsque les modèles d’IA d’OpenAI reçoivent des données, celles-ci sont ensuite triées en une série de “tokens”, des unités qui facilitent l’analyse des données. Finalement, le modèle peut reconnaître des schémas.
Joseph Gratz, un avocat représentant OpenAI, a déclaré que reproduire des articles entiers “n’est pas ce pour quoi il a été conçu et ce qu’il fait”, en ce qui concerne le fonctionnement de ChatGPT.
“Ce n’est pas un système de recherche documentaire. C’est un modèle de langage large”, a souligné Gratz.
Il a également affirmé que les exemples de violation cités par le Times dans le procès n’auraient pu se produire qu’après “des milliers, voire des dizaines de milliers” de requêtes. En essence, Gratz a soutenu que les éditeurs avaient préparé le chatbot à extraire des textes de leurs sites web.
Microsoft affirme que le Times utilise sa ‘puissance et son mégaphone’ pour s’attaquer à une technologie menaçante
Dans leur requête pour faire rejeter l’affaire, les avocats de Microsoft, le plus gros investisseur d’OpenAI, ont écrit qu’il n’était pas illégal pour OpenAI d’absorber ces textes journalistiques. “Dans ce cas, le New York Times utilise sa puissance et son mégaphone pour contester la dernière avancée technologique majeure : le modèle de langage large, ou LLM”, affirment-ils dans le dossier judiciaire, décrivant la technologie qui sous-tend ChatGPT. “Malgré les allégations du Times, le droit d’auteur n’est pas plus un obstacle pour le LLM qu’il ne l’était pour le magnétoscope (ou le piano mécanique, la photocopieuse, l’ordinateur personnel, Internet ou le moteur de recherche).”
Cependant, les organisations de presse soutiennent que le succès mondial de ChatGPT repose en partie sur l’aspiration de volumes importants d’articles protégés par le droit d’auteur, et que ChatGPT constitue désormais effectivement un concurrent en tant que source d’informations fiables.
Cela faisait partie des arguments présentés lors de l’audience de mardi, où un autre aspect du fonctionnement de ChatGPT est devenu un sujet de débat. On parle de “génération augmentée par récupération”. En termes simples : cela intègre des informations à jour et plus spécifiques provenant du web dans les réponses du chatbot.
Bien qu’une partie de ces informations, comme de larges sections d’articles d’actualité, n’ait peut-être pas fait partie des données d’entraînement du chatbot, elles peuvent tout de même apparaître dans les résultats de ChatGPT.
Steven Lieberman, avocat pour The New York Daily News, a déclaré : “Cela permet le tirage gratuit”, en référence aux lecteurs qui se tournent vers les recréations d’OpenAI d’articles de journaux plutôt que d’aller sur le site des éditeurs.
Que pourrait-il se passer ensuite ?
Selon la plainte déposée par le Times, OpenAI pourrait être tenue de verser des milliards de dollars en dommages-intérêts pour avoir copié et utilisé illégalement l’archive du journal. Le procès exige également la destruction de l’ensemble des données de ChatGPT.
Une telle issue serait radicale. Si les éditeurs remportent l’affaire et qu’un juge fédéral ordonne la destruction de l’ensemble des données, cela pourrait complètement bouleverser la société, contraignant OpenAI à recréer son ensemble de données uniquement à partir des œuvres pour lesquelles elle a l’autorisation de les utiliser.
La loi fédérale sur le droit d’auteur prévoit également des sanctions financières sévères, les contrevenants risquant des amendes pouvant atteindre 150 000 dollars pour chaque violation “commise intentionnellement”.
“Si vous copiez des millions d’œuvres, vous pouvez voir comment cela devient un chiffre potentiellement fatal pour une entreprise”, a déclaré Daniel Gervais, codirecteur du programme de propriété intellectuelle à l’Université Vanderbilt, qui étudie l’intelligence artificielle générative, à NPR en août 2023, lorsque le Times envisageait des actions en justice contre OpenAI avant de déposer plainte en décembre. “La loi sur le droit d’auteur est une épée qui va planer au-dessus des entreprises d’IA pendant plusieurs années, à moins qu’elles ne trouvent une solution pour négocier.”
Droits d’auteur 2025 NPR
Points à retenir
- Plusieurs agences de presse se regroupent pour faire face à OpenAI et Microsoft dans une affaire de violation de droits d’auteur.
- Les éditeurs affirment que leurs œuvres ont été utilisées par ChatGPT sans consentement ni compensation.
- OpenAI défend son utilisation des données par des règles de “fair use”, en affirmant que son modèle transforme les œuvres originales.
- Les répercussions possibles d’un verdict en faveur des éditeurs pourraient entraîner des conséquences financières significatives pour OpenAI.
En conclusion, cet affrontement illustre les tensions croissantes entre les avancées technologiques et la protection des droits d’auteur. La résolution de ce litige pourrait avoir des répercussions majeures sur l’avenir des modèles d’intelligence artificielle et leur interaction avec le contenu protégé. Quelle sera donc l’issue de cette lutte entre innovation et droits des créateurs ? Le débat est ouvert.
Nos rédacteurs utilisent l'IA pour les aider à proposer des articles frais de sources fiables à nos utilisateurs. Si vous trouvez une image ou un contenu inapproprié, veuillez nous contacter via le formulaire DMCA et nous le retirerons rapidement. / Our editors use AI to help them offer our readers fresh articles from reliable sources. If you find an image or content inappropriate, please contact us via the DMCA form and we'll remove it promptly.