Depuis quelques années, les internautes s’orientent de plus en plus vers l’intelligence artificielle (IA) pour trouver des réponses à leurs questions. Au lieu d’explorer de multiples sites web et forums, la recherche s’effectue désormais directement via l’IA. Face à cette évolution, Google a choisi de moderniser son moteur de recherche en intégrant des « résumés par IA », une fonctionnalité qui était au départ expérimentale et qui est désormais omniprésente dans chaque recherche. Les utilisateurs commencent à se fier à ces résultats, qui, bien que corrects dans de nombreux cas, affichent tout de même une marge d’erreur, avec une estimation de **1 réponse sur 10 étant inexacte**, ce qui se traduit par des millions d’erreurs générées chaque heure.
Lors de l’avènement d’Internet dans les années 80, et particulièrement dans les années 90, notre manière d’accéder à l’information a radicalement changé. Fini le temps où l’on devait se rendre dans des bibliothèques pour trouver ce que l’on cherchait. Internet a offert un accès instantané à une immense quantité de données. Le développement de l’IA a constitué un tournant majeur, permettant d’exploiter tout ce savoir pour produire des images, des vidéos, ou encore des réponses textuelles.
Le résumé par IA de Google présente une marge d’erreur significative
Alors que l’IA a réalisé des progrès considérables en un temps record, elle n’est pas encore totalement fiable. En effet, AI Overviews, le bot de recherche alimenté par Gemini, affiche près de 90 % de précision. Cette statistique provient d’une analyse effectuée par le New York Times en collaboration avec une startup nommée Oumi. Cette dernière a utilisé des outils comme SimpleQA pour évaluer la fiabilité des réponses fournies par les modèles d’IA.
Les résultats révèlent que 90 % des réponses sont correctes, ce qui signifie qu’une réponse sur dix peut s’avérer inexacte, souvent en raison de ce que l’on appelle des « hallucinations » de l’IA. Par exemple, une question demandant si l’on pouvait utiliser de l’essence pour cuisiner a reçu une réponse affirmative, ce qui est totalement dangereux, car l’essence est toxique.
AI Overviews basé sur Gemini : des améliorations, mais encore des lacunes
Malgré les avancées impressionnantes de l’intelligence artificielle, cette dernière présente encore des erreurs, car elle a tendance à répondre avec certitude et ne remet presque jamais en question ses affirmations. Ainsi, une confiance aveugle envers ses réponses peut mener à la désinformation. SimpleQA est plus fiable, car il vérifie les réponses à partir de plus de 4 000 questions validées, un processus qui peut s’apparenter à un examen. Ce n’est pas la première fois qu’Oumi évalue AI Overviews, puisque lors du lancement de Gemini 2.5, la précision était de 85 %, et avec Gemini 3, elle a grimpé à 91 %.
Bien que ces résultats soient impressionnants en termes d’évaluation, le volume de recherches sur Google entraîne tout de même la génération de **centaines de milliers de fausses informations chaque minute**. Ces résultats n’ont pas été bien accueillis par Google, un porte-parole de l’entreprise affirmant que SimpleQA ne devrait pas être considéré comme un standard de référence.
Points à retenir
- L’IA est une ressource de plus en plus utilisée pour répondre aux questions des utilisateurs.
- Les « résumés par IA » de Google, bien qu’efficaces, présentent une marge d’erreur significative.
- Oumi et SimpleQA jouent un rôle clé dans l’évaluation de la fiabilité des réponses de l’IA.
- La notion d’« hallucinations » démontre les limites actuelles de l’intelligence artificielle.
- La nécessité d’une approche critique envers les réponses générées par l’IA reste primordiale.
En tant que journaliste, je ne peux m’empêcher de réfléchir sur cette évolution rapide et passionnante de la technologie. L’IA, bien qu’impressionnante dans ses capacités, soulève des questions essentielles sur la fiabilité de l’information à l’ère numérique. Comment garantir que nous ne sommes pas induits en erreur par des réponses apparemment véridiques mais potentiellement fallacieuses ? C’est un défi auquel nous devrons faire face collectivement, et il est crucial que chacun prenne conscience de l’importance de la vérification des sources.