Les modèles d’IA manquent de raisonnement essentiel à l’AGI

ByEdia Randrianasolo

Juin 9, 2025

La course à l’intelligence artificielle générale (AGI) est encore loin d’être gagnée, selon des chercheurs d’Apple. Ces derniers ont observé que les modèles d’IA les plus avancés peinent encore à raisonner efficacement.

Les récents progrès en intelligence artificielle ont vu l’apparition de modèles dits à « raisonnement étendu » (LRM) intégrés dans des modèles linguistiques puissants, comme ChatGPT d’OpenAI ou Claude d’Anthropic. Pourtant, leurs capacités fondamentales, leur comportement en termes d’évolutivité et leurs limites restent peu comprises, notent les équipes d’Apple dans un article de juin intitulé « L’illusion de la pensée ».

Ces évaluations se concentrent principalement sur des tests mathématiques et de programmation, insistant sur la justesse de la réponse finale, sans vraiment explorer la faculté de raisonnement. C’est ce manque qu’a voulu combler l’étude.

Sommaire

Des chercheurs d’Apple mettent à l’épreuve la « pensée » des IA

Pour aller au-delà des simples évaluations classiques, les chercheurs ont imaginé une série d’énigmes destinées à distinguer les modèles « pensants » des versions « non pensantes ». Ils ont testé des variantes de Claude Sonnet, les versions mini d’OpenAI (o3-mini et o1) ainsi que les chatbots DeepSeek-R1 et V3.

Le bilan est sans appel : ces modèles les plus avancés s’effondrent totalement au-delà d’un certain seuil de complexité. Leur capacité à généraliser leur raisonnement est très limitée et leurs performances chutent quand les défis deviennent plus ardus, contrairement aux attentes relatives à l’AGI.

« Nous avons constaté que les LRM peinent dans les calculs exacts, ne parviennent pas à utiliser des algorithmes explicites et raisonnent de manière incohérente selon les énigmes. »

Résultats de tests Apple sur modèles IA — Vérification des réponses finales et trace du raisonnement intermédiaire (graphique supérieur), ainsi que la précision plus élevée des modèles non pensants à faible complexité (graphique inférieur). Source : Apple Machine Learning Research

Des IA qui réfléchiraient trop ?

Les chercheurs ont également noté un raisonnement souvent incohérent et superficiel, accompagné d’un phénomène étonnant : les chatbots donnent souvent la bonne réponse très tôt, puis s’égarent dans des raisonnements erronés à force de « trop réfléchir ».

En résumé, les LRM imitent les schémas de raisonnement sans véritablement les intégrer ni les généraliser, ce qui ne correspond pas à la capacité attendue d’une intelligence générale.

« Ces observations remettent en cause l’idée largement répandue des capacités des LRM et suggèrent que les approches actuelles butent probablement sur des barrières fondamentales au raisonnement généralisable. »

Environnements des énigmes pour IA — Illustration des quatre environnements d’énigmes testés. Source : Apple

La course vers l’intelligence artificielle générale

L’AGI est le Graal de l’intelligence artificielle : une machine capable de penser et de raisonner comme un humain, à égalité avec l’intelligence humaine.

Début 2025, Sam Altman, le patron d’OpenAI, affirmait que son entreprise était plus proche que jamais de cet objectif. Selon lui, ils savent désormais comment construire une AGI telle qu’elle est traditionnellement définie.

En fin d’année dernière, Dario Amodei, à la tête d’Anthropic, prédisait que l’AGI surpasserait bientôt les capacités humaines, peut-être d’ici 2026 ou 2027, si on en croit le rythme actuel des avancées.

Points à retenir

Les modèles d’IA avancés restent peu fiables dès que la complexité des tâches monte d’un cran.
Leur raisonnement est souvent plus un simple mimétisme d’un réel processus cognitif qu’une véritable réflexion à la manière humaine.
La tendance à « trop réfléchir » après avoir déjà trouvé la bonne réponse témoigne peut-être d’un excès de zèle algorithmique.
Les tests traditionnels mettent l’accent sur la bonne réponse finale, mais ne permettent pas d’évaluer la vraie capacité de compréhension ou de raisonnement.
L’AGI demeure un horizon lointain, malgré les annonces souvent optimistes des géants du secteur.

Alors que les chercheurs d’Apple sèment un doute bienvenu sur les velléités d’une IA tout-puissante imminente, on se prend à se demander si l’AGI n’est pas davantage une chimère nourrie par nos fantasmes qu’une révolution à court terme. Mais, qui sait, peut-être qu’en attendant, nos futurs assistants virtuels continueront à nous épater… ou à nous faire cogiter un peu plus qu’eux-mêmes.

By Edia Randrianasolo

Articles de la même catégorie

Intelligence Artificielle

Les modèles d’IA manquent de raisonnement essentiel à l’AGI

ByEdia Randrianasolo

Des chercheurs d’Apple mettent à l’épreuve la « pensée » des IA

Des IA qui réfléchiraient trop ?

La course vers l’intelligence artificielle générale

Points à retenir

By Edia Randrianasolo

Articles de la même catégorie

Génie Allemand de l’IA : Des Milliards Égarés avec des Hedge Funds !

Avancées technologiques de la Chine : le chaos s’invite de Silicon Valley à la Maison Blanche !

À partir du 2 août : la UE impose à l’Espagne des règles de transparence sur l’utilisation de l’IA !

Laisser un commentaire Annuler la réponse

Ne ratez pas

Crunchyroll dévoile la nouvelle box »Dragon Ball Z« et d’autres Blu-rays à ne pas manquer !

Découvrez le modèle Messi de la Galaxy Z Fold 8 Ultra, limité à seulement 19 exemplaires dans le monde, à plus de 2 millions de yens !

Comment des portefeuilles Bitcoin ont perdu 70 millions de dollars sans que les dispositifs ne soient touchés : une attaque insoupçonnée !

Quatre Familles Poursuivent Meta, TikTok, Snap et Google pour des Suicides d’Adolescents !