Un nouveau rapport indique que la fonction de recherche de ChatGPT peut être manipulée à l’aide de texte caché contenant des instructions sur la manière dont ChatGPT doit répondre à une question. Des tests ont également montré que ChatGPT pouvait être influencé même sans ces instructions, simplement en utilisant le texte caché.
Manipulation de la recherche ChatGPT par texte caché
Un rapport de The Guardian décrit comment des chercheurs ont utilisé un texte dissimulé sur un faux site pour tromper ChatGPT Search en lui faisant afficher une réponse à partir d’un contenu masqué sur la page web. Ce texte est rendu invisible en utilisant une couleur de police identique à celle de l’arrière-plan, par exemple une police blanche sur un fond blanc.
Les chercheurs ont alors demandé à ChatGPT Search de visiter le site et de répondre à une question basée sur le contenu de la page. ChatGPT Search a navigué sur le site, a indexé le contenu caché et l’a intégré dans sa réponse.
Ils ont d’abord évalué ChatGPT en utilisant une page de contrôle sans exploit sur un faux site d’avis, afin de tester la réponse de ChatGPT. Le système a lu les avis et a fourni une réponse standard.
Les chercheurs ont ensuite dirigé ChatGPT Search vers un faux site où des instructions demandaient de donner un avis positif, et ChatGPT a suivi ces instructions, produisant ainsi des avis favorables.
Un troisième test a impliqué des avis positifs écrits en texte caché mais sans instructions, et là encore, ChatGPT Search a restitué des avis positifs.
The Guardian explique :
« … lorsque le texte caché contenait des instructions pour que ChatGPT renvoie un avis favorable, la réponse était systématiquement entièrement positive. Cela était vrai même lorsqu’il y avait des avis négatifs sur la page – le texte caché pouvait ainsi annuler la note réelle des avis.
La simple inclusion de texte caché par des tiers, sans instruction, peut aussi garantir une évaluation positive. Un test a montré que des avis fictifs très élogieux influençaient le résumé fourni par ChatGPT. »
Ce test rappelle également une expérience menée en mars 2023 par un professeur d’informatique, qui avait réussi à faire dire à ChatGPT qu’il était un expert en voyage dans le temps.
Ces tests démontrent que les données d’apprentissage de ChatGPT, ainsi que le robot de recherche ChatGPT, ingèrent du texte caché tout en étant également susceptibles d’être manipulés. Un expert en sécurité cité par The Guardian explique qu’OpenAI a été informé de cette faille et qu’elle pourrait être corrigée au moment de la publication de l’article.
Pourquoi les moteurs de recherche IA peuvent-ils être manipulés ?
Un des points faibles des moteurs de recherche IA est une technologie appelée RAG (Retrieval Augmented Generation), qui permet de récupérer des informations d’un moteur de recherche afin que l’IA puisse les utiliser pour générer des réponses aux questions basées sur des sources à jour et, en théorie, fiables. Comment les moteurs de recherche IA déterminent-ils les pages web autoritaires ? Par exemple, Perplexity AI utilise une version modifiée de PageRank pour identifier les pages fiables à citer dans son moteur de recherche IA.
ChatGPT Search s’appuie sur Bing, mais il dispose également de son propre robot d’exploration capable de récupérer des informations en temps réel. Il est probable que si un site est inclus dans l’index de recherche de Bing, il l’est également dans ChatGPT Search, ce qui devrait le protéger de l’influence de texte caché. En théorie, les sites comportant du texte caché devraient être exclus de l’index de Bing. Néanmoins, il existe la possibilité de dissimuler un site pour qu’il affiche un contenu différent au robot de recherche de ChatGPT.
Autres manières de manipuler les moteurs de recherche IA
Il existe d’autres méthodes, découvertes par des chercheurs l’année dernière, qui pourraient encore être efficaces (À lire : Des chercheurs découvrent comment optimiser le référencement pour les moteurs de recherche IA). Dans un rapport de recherche de l’année précédente, les chercheurs avaient testé neuf stratégies d’influence sur les moteurs de recherche IA :
Neuf stratégies pour manipuler les moteurs de recherche IA
- Autorité : Modifier le style d’écriture pour en faire des affirmations plus convaincantes
- Optimisation par mots-clés : Ajouter davantage de mots-clés tirés de la requête de recherche
- Ajout de statistiques : Modifier le contenu existant pour inclure des statistiques au lieu d’informations interprétatives.
- Citer des sources (référencer des sources fiables)
- Ajout de citations : Intégrer des citations et références de sources de qualité
- Facilité de compréhension : Rendre le contenu plus accessible
- Optimisation de la fluidité : Rendre le contenu plus articulé
- Mots uniques : Ajouter des termes moins courants, rares et uniques sans changer le sens du contenu
- Termes techniques : Introduire des termes uniques et techniques lorsque cela est pertinent, sans altérer le sens du contenu
Les chercheurs ont constaté que les trois premières stratégies étaient les plus efficaces. En particulier, l’ajout de mots-clés dans les pages web a fortement contribué à cette efficacité.
La manipulation de la recherche ChatGPT
Lors d’une récente conférence sur la recherche, j’ai entendu des affirmations selon lesquelles les aperçus d’IA de Google pourraient être manipulés pour afficher certains produits de grandes marques en réponse à des requêtes de recherche. Je n’ai pas vérifié la véracité de cette information, mais elle émane d’une source réputée et autoritaire. En ce qui concerne ChatGPT Search, j’ai remarqué certains aspects intéressants concernant les sites dont il choisit d’afficher les informations et dans quelles circonstances, ce qui pourrait constituer un moyen d’influencer les classements. Il n’est donc pas surprenant qu’il existe des failles de classement dans la recherche ChatGPT, car les moteurs de recherche IA semblent évoluer de manière similaire aux tous débuts de la recherche traditionnelle.
Image mise en avant par Shutterstock/Antonello Marangi
Points à retenir
- Des tests ont mis en évidence que le texte caché pouvait tromper ChatGPT pour modifier ses réponses.
- La technique RAG permet aux IA de puiser dans des sources à jour pour générer des réponses.
- Évaluer l’autorité des pages par des méthodes comme PageRank reste essentiel pour garantir la fiabilité des informations.
- La manipulation des moteurs de recherche IA semble refléter les débuts des moteurs de recherche traditionnels.
Il est important de surveiller ces dynamiques en constante évolution, car elles soulèvent des questions cruciales sur l’intégrité des informations fournies par les moteurs de recherche. Quelles mesures devraient être mises en place pour éviter de telles manipulations ? La discussion est ouverte.
C’est fascinant de voir comment des techniques comme le texte caché peuvent influencer nos outils, surtout dans un domaine en constante évolution comme la recherche IA.
Sandrine, cet article soulève des questions importantes sur l’intégrité des informations en ligne. La créativité devrait être protégée dans tout cela !
C’est fascinant de voir comment des textes cachés peuvent influencer les réponses de ChatGPT. Ça pose vraiment des questions sur la fiabilité des informations en ligne.
La manipulation de l’information soulève des inquiétudes majeures sur la qualité des réponses. En tant qu’architecte paysagiste, je rêve d’un futur où la vérité pérennise dans nos outils digitaux.
Sandrine, cet article est vraiment éclairant sur la manipulation des moteurs de recherche IA. Il est crucial de rester vigilant pour garantir la fiabilité des informations.