Des chercheurs ont développé un système d’intelligence artificielle (IA) qui semble faire exactement l’inverse de vivre dans l’instant présent. Plutôt que de simplement anticiper quelques étapes, il est capable de projeter ses pensées sur des millions d’étapes à venir.
Dirigée par le mathématicien Sergei Gukov du California Institute of Technology (Caltech), l’équipe a mis au point un nouvel algorithme d’apprentissage automatique destiné à résoudre des problèmes mathématiques nécessitant une série d’étapes très longues, pouvant aller jusqu’à un million d’étapes ou plus.
Plus précisément, l’IA a fait des avancées sur un problème complexe connu sous le nom de conjecture d’Andrews-Curtis, qui a défié les mathématiciens pendant des décennies. Cette conjecture pose fondamentalement la question suivante : certaines énigmes mathématiques peuvent-elles toujours être résolues en utilisant un ensemble de mouvements autorisés, comme réarranger ou annuler des étapes ?
Dans cette optique, le nouveau programme de Caltech avait pour but de « découvrir de longues séquences d’étapes qui sont rares et difficiles à identifier », a déclaré Ali Shehper, l’un des auteurs principaux de l’étude et mathématicien à l’Université Rutgers, dans un communiqué de Caltech. « C’est comme un labyrinthe immense. Ces chemins sont extrêmement longs, et il n’y a qu’une solution. »
Dans une étude préliminaire publiée sur arXiv en août dernier, puis mise à jour ce mardi, Shehper et ses collègues expliquent comment ils ont utilisé leur IA récemment développée pour résoudre des familles de problèmes liés à la conjecture d’Andrews-Curtis, qui implique l’algèbre abstraite. Il est important de préciser qu’ils n’ont pas résolu la conjecture elle-même. Bien que cela puisse sembler décevant, les chercheurs ont réussi à réfuter des contre-exemples potentiels à la conjecture. Si cela ne prouve pas nécessairement la véracité de la conjecture originale, cela renforce cependant sa validité.
« Éliminer certains contre-exemples nous donne confiance dans la validité de la conjecture originale et nous aide à mieux en appréhender le problème principal », a expliqué Shehper. « Cela nous offre de nouveaux moyens d’y réfléchir. » Gukov a comparé ces problèmes mathématiques à un Rubik’s Cube.
« Pouvez-vous reprendre ce Rubik’s Cube compliqué et mélangé à son état d’origine ? Vous devez tester ces très longues séquences de mouvements, et vous ne saurez pas si vous êtes sur la bonne voie avant la toute fin », a-t-il précisé.
Alors, comment l’IA parvient-elle à ses fins ? En pensant de manière originale. En adoptant une approche d’apprentissage par renforcement, les chercheurs ont d’abord soumis à l’IA des problèmes mathématiques simples, avant de graduellement lui imposer des tâches plus difficiles. « Elle essaie divers mouvements et est récompensée lorsqu’elle réussit à résoudre les problèmes », a précisé Shehper. « Nous l’encourageons à reproduire ce qui fonctionne tout en gardant une certaine curiosité. Au final, elle développe des stratégies nouvelles, souvent supérieures à celles des humains. C’est ça, la magie de l’apprentissage par renforcement. »
L’algorithme a ainsi appris à générer de longues séquences de mouvements inattendus, que les chercheurs ont appelés « super mouvements ». En revanche, la production de ChatGPT est souvent plus prévisible.
« Si vous demandez à ChatGPT de rédiger une lettre, il vous proposera quelque chose de typique. Il est peu probable qu’il produise quelque chose d’unique et d’original. C’est un bon perroquet », a déclaré Gukov. « Notre programme, lui, est capable de proposer des solutions atypiques. »
Les chercheurs envisagent que ce type de prévision intelligente pourrait s’avérer particulièrement utile dans des événements tels que les crashs financiers. Bien que les programmes d’apprentissage automatique actuels n’aient pas atteint un tel niveau de sophistication prédictive, ils envisagent que leurs méthodes pourraient contribuer à un jour réaliser de telles prévisions.
« En gros, notre programme sait apprendre à apprendre », a fait savoir Gukov. « Il pense en dehors des sentiers battus. » De plus, l’équipe a mis l’accent sur des approches qui ne nécessitent pas une puissance de calcul importante, rendant leur travail accessible à d’autres chercheurs utilisant des ordinateurs de petite taille.
Bien que les applications pratiques de cette réalisation puissent ne pas être immédiatement apparentes dans notre quotidien, ces travaux s’inscrivent dans une série d’efforts de chercheurs visant à optimiser les algorithmes d’apprentissage automatique pour résoudre des problèmes humains, sans intention destructive pour notre société.
Points à retenir
- Le programme d’IA développé par Caltech est capable d’anticiper des séquences d’étapes mathématiques très longues.
- La conjecture d’Andrews-Curtis reste non résolue, mais des avancées ont été faites en réfutant des contre-exemples.
- L’algorithme utilise une approche d’apprentissage par renforcement pour produire des stratégies novatrices.
- Les chercheurs souhaitent que leurs méthodes contribuent, à terme, à des prévisions intelligentes dans divers domaines.
- L’accent est mis sur la faisabilité et l’accessibilité des travaux pour d’autres chercheurs.
Ce type de recherche souligne l’importance de l’innovation dans le domaine mathématique et ses implications potentielles dans la résolution de problèmes complexes dans d’autres disciplines. La perspective d’intégrer l’intelligence artificielle dans ces défis ouvre le débat sur la manière dont cette technologie pourrait remodeler notre compréhension des systèmes complexes.