Étude : L’IA est moins fiable que prévu dans les diagnostics médicaux
11 février 2026, 10:51

Face à des douleurs aiguës, de nombreuses personnes se tournent vers les chatbots médicaux en quête de conseils. Cependant, une étude menée par l’Université d’Oxford révèle que ces systèmes affichent des performances décevantes, peu meilleures qu’une recherche sur Internet.
Dans cette étude, environ 1300 participants ont été confrontés à des symptômes fictifs soigneusement sélectionnés par des médecins, allant d’une jeune mère épuisée à un homme souffrant de douleurs abdominales et de sang dans les urines.
Les chatbots, testés dans ce contexte, devaient diagnostiquer les symptômes et conseiller les participants quant aux démarches à suivre, que ce soit appeler un ambulancier ou prendre rendez-vous chez le médecin. Les médecins avaient au préalable défini les solutions appropriées pour chaque scénario.
Des résultats mitigés pour les chatbots
Les résultats sont révélateurs : moins de 35 % des diagnostics posés par les chatbots étaient corrects, tandis qu’ils réussissaient à recommander le bon suivi dans moins de 44 % des cas. Les utilisateurs de l’IA n’ont donc pas meilleur résultat que ceux qui s’informent sans ces outils.
Surprenant, les chatbots ont obtenu de meilleurs résultats dans des tests sans interaction humaine réelle, identifiant des maladies correctement dans 95 % des cas et recommandant les bonnes démarches dans environ 56 % des situations.
Inquiétudes sur l’interaction avec les utilisateurs
L’équipe de recherche a détaillé certaines difficultés rencontrées : beaucoup d’utilisateurs ne savaient pas quelles informations donner aux chatbots, alors que les réponses de ces mêmes systèmes variaient largement selon la formulation des questions. Souvent, les réponses mêlaient informations correctes et erronées.
Anne Reinhardt, spécialiste en communication de la santé, souligne que les études précédentes se concentraient sur des scénarios standardisés, négligeant l’interaction cruciale avec des utilisateurs décrivant leurs symptômes en détail. Beaucoup de personnes n’ont pas encore l’expérience nécessaire pour interagir efficacement avec les chatbots.
Une IA encore loin de remplacer les médecins
Rebecca Payne, médecin et membre de l’équipe de recherche, déclare : « Ces résultats illustrent les défis de développement d’IA capables de soutenir adéquatement les personnes dans des domaines aussi sensibles que la santé. La technologie n’est pas encore prête à remplacer les médecins. »
Iryna Gurevych, également experte, souligne que les chatbots doivent aller au-delà de répondre aux questions pour être utiles en tant que premier contact ; ils doivent guider les utilisateurs à fournir des informations complètes et poser des questions supplémentaires si nécessaire.
L’équipe de recherche appelle à une évaluation plus rigoureuse des modèles de langage pour mieux mesurer leur efficacité en interaction avec les humains.
Points à retenir
- Les chatbots médicaux présentent des taux de diagnostic inférieurs à 35 % dans des situations réelles.
- Les utilisateurs hésitent souvent sur les informations à fournir lors de l’interaction avec les IA.
- Les tests contrôlés montrent que les IA peuvent performer mieux sans interactions humaines.
- La confiance croissante des utilisateurs pourrait être contre-productive si elle n’est pas accompagnée d’une meilleure formation et compréhension des outils numériques.
- Une recherche supplémentaire est nécessaire pour améliorer la conception des chatbots afin qu’ils soient plus interactifs et utiles.
En tant que passionné de technologie et de santé, je suis intrigué par les possibilités offertes par l’IA dans le domaine médical. Cependant, cette étude me rappelle l’importance de l’écoute humaine et du jugement médical. L’IA, même si elle avance à grands pas, ne doit pas eclipses l’intuition et l’expérience des professionnels de santé. Nous vivons un tournant dans la manière dont nous appréhendons les soins, mais il est essentiel d’assurer que l’accompagnement humain reste au cœur de cette transition.