Il est indéniable que peu d’entreprises ont contribué de manière inattendue à l’augmentation du bruit généré par l’IA en ligne autant qu’OpenAI. Malgré ses meilleures intentions — et en violation de ses conditions d’utilisation — ses modèles linguistiques d’IA sont souvent utilisés pour composer des spams, et sa recherche pionnière a inspiré d’autres à construire des modèles d’IA capables de faire de même. Cet afflux de contenu généré par l’IA a encore réduit l’efficacité des moteurs de recherche axés sur le SEO tels que Google. En 2024, la recherche sur le web est dans un état préoccupant.
Il est donc intéressant qu’OpenAI propose désormais une solution potentielle à ce problème. Jeudi, OpenAI a dévoilé un prototype de moteur de recherche alimenté par l’IA, baptisé SearchGPT, qui vise à fournir aux utilisateurs des réponses rapides et précises provenant du web. C’est également un défi direct pour Google, qui a tenté d’appliquer l’IA générative à la recherche sur le web (mais avec peu de succès).
La société prévoit d’intégrer les aspects les plus utiles de ce prototype temporaire dans ChatGPT à l’avenir. ChatGPT (et Microsoft Copilot) peut déjà effectuer des recherches sur le web via Bing, mais SearchGPT semble être l’interface conçue spécifiquement par OpenAI pour la recherche assistée par l’IA.
SearchGPT tente de rationaliser le processus de recherche d’informations en ligne en combinant les modèles d’IA d’OpenAI (comme GPT-4o) et des données web en temps réel. Comme avec ChatGPT, les utilisateurs peuvent apparemment poser des questions de suivi à SearchGPT, avec le modèle d’IA maintenant le contexte tout au long de la conversation.
Peut-être plus important encore, du point de vue de l’exactitude, le prototype de SearchGPT (que nous n’avons pas testé nous-mêmes) inclut apparemment des fonctionnalités qui attribuent clairement les sources web. Les réponses comprennent des citations en ligne et des liens, tandis qu’une barre latérale affiche des liens vers d’autres sources.
OpenAI n’a pas encore indiqué comment elle obtient ses données web en temps réel et si elle collabore avec un fournisseur de moteur de recherche existant (comme c’est le cas actuellement avec Bing pour ChatGPT) ou si elle construit son propre système de récupération et d’indexation web.
Un moyen d’éviter que les éditeurs ne bloquent OpenAI
ChatGPT peut déjà effectuer des recherches sur le web via Bing, mais depuis août dernier, lorsqu’OpenAI a révélé un moyen de bloquer son robot d’exploration, cette fonctionnalité n’est pas aussi utile qu’elle pourrait l’être. De nombreux sites, comme [LesNews] (qui bloque le robot d’OpenAI dans le cadre de la politique de notre maison mère), n’apparaîtront pas dans les résultats de ChatGPT en raison de cela.
SearchGPT semble dénouer l’association entre le robot d’exploration d’OpenAI pour la collecte de données d’entraînement et le désir des utilisateurs de chatbot d’OpenAI de rechercher sur le web. Notamment, dans la nouvelle annonce de SearchGPT, OpenAI déclare : “Les sites peuvent apparaître dans les résultats de recherche même s’ils se désinscrivent de la formation IA générative.”
Cependant, OpenAI travaille sur un moyen pour les éditeurs de gérer leur apparence dans les résultats de SearchGPT afin que “les éditeurs aient plus de choix.” La société précise également que la capacité de SearchGPT à naviguer sur le web est distincte de la formation des modèles d’IA d’OpenAI.
Un avenir incertain pour la recherche alimentée par l’IA
OpenAI affirme que SearchGPT rendra les recherches sur le web plus rapides et plus faciles. Cependant, l’efficacité de la recherche alimentée par l’IA par rapport aux méthodes traditionnelles est encore inconnue, la technologie étant encore à ses débuts. Mais soyons francs : le moteur de recherche le plus en vue actuellement est plutôt décevant.
Au cours de l’année écoulée, nous avons vu Perplexity.ai prendre de l’ampleur en tant que remplaçant potentiel de Google, mais le service a été confronté à des problèmes de confabulations et d’accusations de plagiat parmi les éditeurs, y compris le parent de [LesNews] Condé Nast.
Contrairement à Perplexity, OpenAI a de nombreux partenariats avec des éditeurs, et elle souligne qu’elle souhaite travailler en particulier avec les créateurs de contenu. “Nous sommes engagés en faveur d’un écosystème prospère d’éditeurs et de créateurs,” déclare OpenAI dans son communiqué de presse. “Nous espérons aider les utilisateurs à découvrir les sites et expériences des éditeurs, tout en apportant plus de choix à la recherche.”
Dans une déclaration pour le communiqué de presse d’OpenAI, Nicholas Thompson, PDG de The Atlantic (qui a un accord de contenu avec OpenAI), a exprimé son optimisme quant au potentiel de la recherche IA : “La recherche IA va devenir l’un des principaux moyens d’explorer Internet, et il est crucial, dans ces débuts, que la technologie soit construite d’une manière qui valorise, respecte et protège le journalisme et les éditeurs,” a-t-il déclaré. “Nous nous réjouissons de collaborer avec OpenAI dans ce processus et de créer une nouvelle façon pour les lecteurs de découvrir The Atlantic.”
OpenAI a expérimenté d’autres dérivés de sa technologie de modèle linguistique d’IA qui n’ont pas eu de succès retentissant (notamment, les GPT viennent à l’esprit), il faudra donc du temps pour savoir si les techniques derrière SearchGPT ont un bon potentiel — et si elles peuvent fournir des résultats précis sans halluciner. Mais l’état actuel de la recherche sur le web invite à de nouvelles expérimentations pour séparer le signal du bruit, et il semble qu’OpenAI se lance dans l’aventure.
Actuellement, OpenAI déploie SearchGPT à un petit groupe d’utilisateurs et d’éditeurs pour des tests et des retours d’expérience. Ceux qui souhaitent essayer le prototype peuvent s’inscrire sur la liste d’attente sur le site de la société.
En tant que journaliste, je m’interroge sur les implications de outils comme SearchGPT pour les médias. Loin d’être une simple nouveauté, ces avancées technologiques pourraient redéfinir notre manière d’accéder à l’information et de collaborer avec les éditeurs. Je suis curieux de voir comment ce nouveau modèle pourrait non seulement affecter le journalisme, mais aussi les attentes des utilisateurs en matière de recherche.