La course à l’intelligence artificielle générale (AGI) est encore loin d’être gagnée, selon des chercheurs d’Apple. Ces derniers ont observé que les modèles d’IA les plus avancés peinent encore à raisonner efficacement.
Les récents progrès en intelligence artificielle ont vu l’apparition de modèles dits à « raisonnement étendu » (LRM) intégrés dans des modèles linguistiques puissants, comme ChatGPT d’OpenAI ou Claude d’Anthropic. Pourtant, leurs capacités fondamentales, leur comportement en termes d’évolutivité et leurs limites restent peu comprises, notent les équipes d’Apple dans un article de juin intitulé « L’illusion de la pensée ».
Ces évaluations se concentrent principalement sur des tests mathématiques et de programmation, insistant sur la justesse de la réponse finale, sans vraiment explorer la faculté de raisonnement. C’est ce manque qu’a voulu combler l’étude.
Des chercheurs d’Apple mettent à l’épreuve la « pensée » des IA
Pour aller au-delà des simples évaluations classiques, les chercheurs ont imaginé une série d’énigmes destinées à distinguer les modèles « pensants » des versions « non pensantes ». Ils ont testé des variantes de Claude Sonnet, les versions mini d’OpenAI (o3-mini et o1) ainsi que les chatbots DeepSeek-R1 et V3.
Le bilan est sans appel : ces modèles les plus avancés s’effondrent totalement au-delà d’un certain seuil de complexité. Leur capacité à généraliser leur raisonnement est très limitée et leurs performances chutent quand les défis deviennent plus ardus, contrairement aux attentes relatives à l’AGI.
« Nous avons constaté que les LRM peinent dans les calculs exacts, ne parviennent pas à utiliser des algorithmes explicites et raisonnent de manière incohérente selon les énigmes. »

Des IA qui réfléchiraient trop ?
Les chercheurs ont également noté un raisonnement souvent incohérent et superficiel, accompagné d’un phénomène étonnant : les chatbots donnent souvent la bonne réponse très tôt, puis s’égarent dans des raisonnements erronés à force de « trop réfléchir ».
En résumé, les LRM imitent les schémas de raisonnement sans véritablement les intégrer ni les généraliser, ce qui ne correspond pas à la capacité attendue d’une intelligence générale.
« Ces observations remettent en cause l’idée largement répandue des capacités des LRM et suggèrent que les approches actuelles butent probablement sur des barrières fondamentales au raisonnement généralisable. »

La course vers l’intelligence artificielle générale
L’AGI est le Graal de l’intelligence artificielle : une machine capable de penser et de raisonner comme un humain, à égalité avec l’intelligence humaine.
Début 2025, Sam Altman, le patron d’OpenAI, affirmait que son entreprise était plus proche que jamais de cet objectif. Selon lui, ils savent désormais comment construire une AGI telle qu’elle est traditionnellement définie.
En fin d’année dernière, Dario Amodei, à la tête d’Anthropic, prédisait que l’AGI surpasserait bientôt les capacités humaines, peut-être d’ici 2026 ou 2027, si on en croit le rythme actuel des avancées.
Points à retenir
- Les modèles d’IA avancés restent peu fiables dès que la complexité des tâches monte d’un cran.
- Leur raisonnement est souvent plus un simple mimétisme d’un réel processus cognitif qu’une véritable réflexion à la manière humaine.
- La tendance à « trop réfléchir » après avoir déjà trouvé la bonne réponse témoigne peut-être d’un excès de zèle algorithmique.
- Les tests traditionnels mettent l’accent sur la bonne réponse finale, mais ne permettent pas d’évaluer la vraie capacité de compréhension ou de raisonnement.
- L’AGI demeure un horizon lointain, malgré les annonces souvent optimistes des géants du secteur.
Alors que les chercheurs d’Apple sèment un doute bienvenu sur les velléités d’une IA tout-puissante imminente, on se prend à se demander si l’AGI n’est pas davantage une chimère nourrie par nos fantasmes qu’une révolution à court terme. Mais, qui sait, peut-être qu’en attendant, nos futurs assistants virtuels continueront à nous épater… ou à nous faire cogiter un peu plus qu’eux-mêmes.