Des chercheurs examinent les répercussions de l’intelligence artificielle dans le domaine de la santé mentale et l’avenir de la psychothérapie.
Étude : Quand ELIZA rencontre des thérapeutes : Un test de Turing pour le cœur et l’esprit. Crédit image : MUNGKHOOD STUDIO/Shutterstock.com
Dans une étude récente publiée dans PLOS Mental Health, des chercheurs ont examiné si les réponses rédigées par des thérapeutes experts et le modèle de langage ChatGPT-4 pouvaient être différenciées par des humains.
La question “Les machines peuvent-elles penser ?” a été posée par Alan Turing après la Seconde Guerre mondiale. Depuis les années 1950, la technologie a connu des avancées significatives, et des preuves croissantes suggèrent que l’intelligence artificielle générative (GenAI) pourrait être bénéfique en psychothérapie.
En outre, des études récentes révèlent des effets prometteurs de la GenAI en tant qu’outil complémentaire ou indépendant dans le cadre des soins psychologiques. Les rapports indiquent que l’IA peut rédiger des contenus avec empathie, ce qui est particulièrement bien noté par les thérapeutes et dépasse la performance des professionnels.
À propos de l’étude
Dans cette étude, les chercheurs ont investigué la capacité d’un panel de participants à distinguer les réponses liées à la thérapie de couple fournies par des experts humains et par ChatGPT.
En premier lieu, des experts titulaires de diplômes avancés en psychologie de counseling, psychologie clinique, psychiatrie et thérapie de couple ont été recrutés. Ces experts ont été répartis de manière aléatoire pour recevoir l’un des deux ensembles de vignettes sur la thérapie de couple. Ils avaient un mois pour rédiger leurs réponses.
Une fois les réponses rédigées, les experts d’un groupe ont classé les trois réponses de l’autre groupe, qui avaient de fortes chances de réussir aux tests des facteurs communs et au test de Turing, et vice versa. ChatGPT-4 a ensuite été sollicité avec un seul prompt pour générer des réponses.
Ce prompt définissait des critères tels que le professionnalisme, l’empathie, l’alliance thérapeutique, l’efficacité et la compétence culturelle. Les réponses de ChatGPT-4 ont également été évaluées par les auteurs de l’étude.
Les meilleures vignettes ont été sélectionnées pour rivaliser avec celles des experts humains, et les réponses les plus pertinentes ont été regroupées puis distribuées sous forme d’enquête à un panel d’individus divers. Cet échantillon de répondants représentait la population des États-Unis.
Les participants ont été randomisés pour recevoir un message d’un thérapeute ou de ChatGPT-4 et ont été invités à 1) évaluer leur alignement avec les facteurs communs et 2) deviner s’il était rédigé par ChatGPT ou un thérapeute humain.
Résultats
Au total, 13 thérapeutes ayant au moins cinq ans d’expérience ont constitué le panel d’experts. La majorité d’entre eux avaient une formation en thérapie de couple. De plus, le panel des répondants à l’enquête était composé de 830 individus, dont l’âge moyen était de 45 ans.
Parmi eux, 50,6 % étaient des femmes, 47,9 % des hommes et 0,2 % non binaires. Près de 60 % d’entre eux étaient en couple, et 18 % avaient déjà eu recours à une thérapie de couple.
Par ailleurs, 49,4 % des répondants étaient blancs non hispaniques, 18,8 % étaient noirs, 16,8 % étaient hispaniques blancs, et 5 % étaient asiatiques. Les répondants ont montré une faible performance dans leur capacité à identifier si les réponses provenaient de ChatGPT ou de thérapeutes.
Ils ont correctement identifié les thérapeutes seulement 5 % plus souvent que ChatGPT. De plus, les réponses de ChatGPT ont été évaluées plus favorablement sur tous les facteurs thérapeutiques communs comparativement aux réponses des thérapeutes.
Les réponses de ChatGPT ont été jugées plus empathiques, culturellement compétentes et engageantes que celles des thérapeutes. Les participants qui croyaient qu’un thérapeute avait rédigé la réponse lui attribuaient une note plus élevée, alors que ceux pensant à ChatGPT lui donnaient une évaluation inférieure. Cela a conduit à une analyse secondaire révélant un biais d’attribution marqué.
En effet, les sujets réagissaient plus positivement aux vignettes quand elles étaient attribuées à des thérapeutes. De plus, les réponses ont été notées en fonction de l’exactitude de l’attribution.
Par exemple, les réponses des thérapeutes mal attribuées à ChatGPT ont reçu les notes les moins favorables. Les chercheurs ont également comparé les différences dans les parties du discours et le sentiment entre les réponses des thérapeutes et celles de ChatGPT.
Les réponses générées par ChatGPT étaient plus longues et comportaient un plus grand nombre de sentiments positifs, de noms, d’adjectifs, de verbes, de pronoms et d’adverbes que les réponses écrites par des humains.
Même en contrôlant la longueur des réponses, celles de ChatGPT comprenaient davantage d’adjectifs et de noms, mais avaient un nombre similaire d’adverbes, de pronoms et de verbes.
Conclusions
La capacité à identifier correctement les réponses de ChatGPT et des thérapeutes était seulement légèrement supérieure au hasard.
Cela indique que les individus éprouvent des difficultés à distinguer les réponses de machines et d’humains, soutenant ainsi la prédiction de Turing selon laquelle les humains ne seront pas en mesure de différencier les réponses produites par les machines de celles produites par des humains. De plus, les réponses produites par ChatGPT ont été évaluées beaucoup plus haut sur tous les facteurs communs de la thérapie par rapport à celles des humains.
Les limites de l’étude incluent le nombre restreint de vignettes, qui ne représente qu’une fraction des possibilités dans des contextes valides, l’utilisation d’un seul prompt pour générer des réponses de GenAI et le nombre limité de thérapeutes experts, y compris quelques thérapeutes de couple.
Alors que l’incorporation de la GenAI dans les contextes thérapeutiques semble envisageable, les professionnels de la santé mentale doivent approfondir leur compréhension de l’apprentissage machine, développer leur compétence technique dans ce domaine, et veiller à une formation et une supervision minutieuses de ces modèles.
Points à retenir
- Les différences de réponses entre les thérapeutes humains et ChatGPT sont difficilement identifiables pour le grand public.
- Les réponses générées par l’IA sont souvent perçues comme plus empathiques et culturellement pertinentes.
- Un biais d’attribution influence la perception des réponses en fonction de l’auteur perçu.
En conclusion, cette étude remet en question nos certitudes sur la place des machines dans la psychothérapie et soulève des enjeux éthiques et pratiques pour le futur. Si l’intégration de l’IA peut offrir des solutions novatrices, elle devra être accompagnée d’une réflexion critique sur l’humain et la technologie dans le soin psychologique. Quels seront les impacts à long terme de cette évolution sur la relation thérapeutique ?
Cette étude soulève des questions fascinantes sur l’avenir de la psychothérapie. Peut-on vraiment faire confiance à une IA pour des émotions aussi humaines ?
C’est fascinant de voir comment l’intelligence artificielle prend de l’ampleur dans la psychothérapie. Les machines peuvent-elles vraiment comprendre nos émotions ? C’est une question qui mérite réflexion !
C’est fascinant de voir comment l’IA pourrait révolutionner la psychothérapie. Avec des approches innovantes, on peut transformer les défis émotionnels en belles possibilités de créativité personnelle.
L’étude sur l’IA et la psychothérapie ouvre des horizons fascinants. La technologie, si bien maîtrisée, peut enrichir notre approche du soin tout en préservant l’humain.
L’essor de l’intelligence artificielle en santé mentale est fascinant. Cela ouvre de nouvelles avenues pour améliorer l’empathie dans les soins. Quelles seront les conséquences sur les relations humaines ?