On Tuesday, le moteur de recherche alimenté par l’IA, Perplexity, a dévoilé un nouveau programme de partage des revenus pour les éditeurs, marquant un tournant significatif dans son approche de l’utilisation du contenu tiers, rapporte CNBC. Cette annonce fait suite à des allégations de plagiat provenant de grandes entreprises médiatiques, y compris Forbes et Wired. Perplexity, valorisé à plus de 1 milliard de dollars, vise à rivaliser avec le géant de la recherche Google.
“Pour soutenir encore mieux le travail essentiel des organisations médiatiques et des créateurs de contenu en ligne, nous devons nous assurer que les éditeurs peuvent prospérer à mesure que Perplexity se développe,” écrit l’entreprise dans un article de blog annonçant le programme. “C’est pourquoi nous sommes ravis d’annoncer le programme de partenaires Perplexity et notre première série de partenaires : TIME, Der Spiegel, Fortune, Entrepreneur, The Texas Tribune, et WordPress.com.”
Dans le cadre de ce programme, Perplexity partagera un pourcentage des revenus publicitaires avec les éditeurs lorsque leur contenu sera cité dans des réponses générées par IA. Ce partage des revenus s’applique sur une base par article et peut potentiellement se multiplier si plusieurs articles d’un même éditeur sont utilisés dans une seule réponse. Certains fournisseurs de contenu, comme WordPress.com, envisagent de transmettre une partie de ces revenus aux créateurs de contenu.
Un communiqué de presse de WordPress.com indique que rejoindre le programme des éditeurs de Perplexity permet aux contenus de WordPress.com d’apparaître dans la section “Keep Exploring” sur leurs pages Discover. “Cela signifie que vos articles seront inclus dans leur index de recherche et pourront être mis en avant comme réponse sur leur moteur de réponses ainsi que dans leur flux Discover,” écrit la société de blog. “Si votre site est référencé dans un résultat de recherche de Perplexity où l’entreprise génère des revenus publicitaires, vous serez éligible pour un partage de revenus.”
Dmitry Shevelenko, responsable commercial de Perplexity, a déclaré à CNBC que l’entreprise avait commencé à discuter avec des éditeurs en janvier, avec les détails du programme finalisés début 2024. Il a rapporté un vif intérêt initial, avec plus d’une douzaine d’éditeurs qui ont pris contact dans les heures suivant l’annonce.
Dans le cadre du programme, les éditeurs auront également accès aux API de Perplexity, qui peuvent être utilisées pour créer des “moteurs de réponses” personnalisés et des comptes “Enterprise Pro” offrant des “capabilités de confidentialité et de sécurité des données améliorées” pour tous les employés des éditeurs du programme pendant un an.
### Accusations de plagiat
L’annonce du partage des revenus fait suite à un mois difficile pour la startup d’IA. Mi-juin, Forbes a rapporté avoir trouvé son contenu dans l’outil Pages de Perplexity avec une attribution minimale. Pages permet aux utilisateurs de Perplexity de curer du contenu et de le partager avec d’autres. Le même type d’allégations a été émis par Wired, notant également des motifs de trafic suspects provenant d’adresses IP susceptibles d’être liées à Perplexity, qui ignoraient les exclusions des fichiers robots.txt. Perplexity a également été accusé de manipuler la chaîne d’identification de ses bots de crawl pour contourner les blocages de sites.
En tant que politique d’entreprise, le parent d’Ars Technica, Condé Nast, interdit les scrapeurs de contenu basés sur l’IA, et son PDG Roger Lynch a témoigné devant le Sénat américain plus tôt cette année que l’IA générative avait été construite à partir de “biens volés”. Condé a envoyé une lettre de cessation et d’abstention à Perplexity plus tôt ce mois-ci.
Cependant, les problèmes des éditeurs ne sont peut-être pas le seul souci de Perplexity. Dans certains tests de recherche que nous avons effectués en février, Perplexity a gravement mélangé certaines réponses, même lorsque des citations étaient facilement disponibles. Depuis nos premiers tests, la précision des résultats de Perplexity semble s’être améliorée, mais fournir des réponses inexactes reste un potentiel problème.
Comparés aux utilisateurs de la version gratuite, les utilisateurs de Perplexity qui paient 20 $ par mois peuvent accéder à des LLMs plus performants tels que GPT-4o et Claude 3, de sorte que la qualité et l’exactitude des résultats peuvent varier considérablement selon que l’utilisateur est abonné ou non. L’ajout de citations à chaque réponse de Perplexity permet aux utilisateurs de vérifier la précision — s’ils prennent le temps de le faire.
La démarche de Perplexity s’inscrit dans un contexte de tensions entre les entreprises d’IA et les créateurs de contenu. Certaines entreprises médiatiques, telles que The New York Times, ont intenté des poursuites contre des fournisseurs d’IA comme OpenAI et Microsoft, les accusant d’infraction au droit d’auteur dans la formation des grands modèles linguistiques. OpenAI a conclu des accords de licence médiatique avec de nombreux éditeurs pour obtenir un accès à des données d’entraînement de haute qualité et éviter des poursuites futures.
Dans ce cas, Perplexity ne utilise pas les articles et contenus sous licence pour entraîner des modèles d’IA, mais cherche à obtenir une autorisation légale pour reproduire le contenu des éditeurs sur son site.
### Réflexion personnelle
Cet article me fait réfléchir sur l’évolution du paysage médiatique à l’ère numérique. La manière dont les entreprises d’IA interagissent avec les éditeurs souligne l’importance d’une rémunération équitable pour le contenu. En tant que journaliste, je me demande comment ces développements influenceront la création de contenu et les droits des créateurs. Il est crucial de trouver un équilibre qui soutienne à la fois l’innovation technologique et la protection des droits d’auteur. La collaboration est peut-être la voie à suivre.