Vous le savez sans doute, la publicité en ligne ne cesse de le rappeler : grâce à un simple prompt, il est possible de générer un jeu vidéo. L’intelligence artificielle peut le créer, mais elle ne peut pas y jouer. Ce n’est pas que les jeux soient intrinsèquement difficiles ; c’est que le monde réel suit des lois physiques universelles, alors que les jeux vidéo en sont souvent affranchis.
Créer, pas jouer. La situation est fascinante : des outils comme Cursor ou Claude permettent de générer des clones fonctionnels de jeux classiques, comme ‘Asteroids’ par exemple. Pourtant, ces systèmes échouent même à surmonter le premier niveau de leur propre création. Julian Togelius, directeur du Game Innovation Lab à l’Université de New York et co-fondateur de Modl.ai, explore cette question depuis des mois et partage ses réflexions dans une interview.
La programmation, un jeu à part. Togelius décrit la programmation comme une tâche structurée, un jeu très bien conçu. Chaque ligne de code correspond à un objectif clair, des critères de succès vérifiables et des retours sur d’éventuelles erreurs, avec une indication précise sur la nature des défaillances. Les modèles de langage (LLMs) entraînés sur d’énormes quantités de code et optimisés par apprentissage par renforcement s’attaquent à précisément ce genre de défi. La programmation est, dans ce contexte, un jeu remarquablement « bien portatif », ce qui explique son attrait pour de nombreux individus.
Cependant, les jeux vidéo présentent un autre défi : leur espace d’action est soumis à des règles parfois arbitraires, le retour d’information peut être instantané ou se faire attendre, le raisonnement spatial est crucial et la marge d’erreur est réduite. Quand un modèle d’IA tente de jouer, les résultats, comme l’a documenté Togelius, sont sans appel : « un échec total ».
Avec assistance, s’il vous plaît. En mai 2025, Gemini 2.5 Pro a réussi à terminer ‘Pokémon Bleu’, mais cela lui a pris un temps considérablement plus long que n’importe quel joueur humain, avec des erreurs répétées et en s’appuyant sur des logiciels auxiliaires. La revue TIME a analysé pourquoi les systèmes d’IA ont tant de mal avec ‘Pokémon’, malgré sa complexité relativement accessible. Ces systèmes ont besoin d’APIs spécifiques pour consulter des guides stratégiques. La documentation abondante sur des jeux comme ‘Pokémon’ ou ‘Minecraft’ facilite leur compréhension.
Le secret réside dans les lois physiques. Mais pourquoi un modèle de langage peut-il rédiger un essai sur la physique quantique tout en échouant dans des jeux comme ‘Halo’ et ‘Space Invaders’ ? Togelius explique que « ces deux jeux sont, en certains sens, plus différents que deux essais académiques. » Les jeux vidéo sont très variés ; chacun a ses propres règles, sa logique spatiale et son système de récompenses. Les mécaniques d’un jeu de plateforme diffèrent totalement de celles d’un ‘Tetris’. Le raisonnement spatial, essentiel pour la plupart des jeux, n’est pas inclus dans les données d’entraînement des modèles de langage car il varie d’un jeu à l’autre.
Considérons une tâche jugée encore plus complexe que de jouer à ‘Super Mario’ : conduire une voiture autonome. Et c’est là où les IA excellent. La différence avec les jeux repose sur le fait que le monde réel respecte des lois physiques universelles. L’asphalte se comporte de la même manière à San Francisco qu’à Shanghai, les feux de signalisation fonctionnent sur des principes identiques, et le véhicule réagit toujours de façon semblable. D’après Togelius, « conduire est bien plus homogène que l’ensemble des jeux vidéo. » Apprendre à conduire vous permet de le faire n’importe où, alors qu’apprendre à jouer à ‘Doom’ ne vous aidera pas à jouer à ‘Age of Empires’.
Un critère révélateur. C’est pourquoi Togelius suggère d’utiliser les jeux vidéo comme critère pour mesurer le succès d’une IA : il faut évaluer si un agent peut maîtriser n’importe quel jeu parmi le top 100 de Steam dans un temps comparable à celui d’un joueur humain, sans accès à des documents préalables ni intégration spécifique. À cette norme, aucun système n’a encore réussi à se rapprocher.
Points à retenir
- Les jeux vidéo sont régis par des règles non linéaires, rendant leur appréhension plus complexe pour les IA.
- La programmation est perçue comme un défi structuré, attractif pour de nombreux programmeurs.
- Les systèmes d’IA comme Gemini 2.5 Pro montrent des limites dans leur capacité d’adaptation aux jeux.
- Le raisonnement spatial est fondamental pour naviguer dans les jeux, mais difficile à modéliser pour les IA.
- Les lois physiques constantes du monde réel facilitent l’apprentissage pour les IA dans des tâches comme la conduite.
En conclusion, cela soulève une question fascinante sur l’avenir des IA dans le domaine du divertissement. Vérra-t-on un jour des systèmes capables d’apprendre et de jouer aux jeux vidéo de manière fluide, comme un humain ? L’interaction entre l’homme et la machine pourrait devenir un terrain de jeu où chaque progrès pourrait redéfinir ce que signifie jouer. Qu’en pensez-vous ?