Google a discrètement publié une mise à jour majeure de son modèle d’intelligence artificielle populaire, Gemini, qui désormais explique son processus de raisonnement, établit de nouveaux records de performance dans les tâches mathématiques et scientifiques, et propose une alternative gratuite aux services premium d’OpenAI.

Le nouveau modèle Gemini 2.0 Flash Thinking, lancé mardi dans Google AI Studio sous la désignation expérimentale “Exp-01-21”, a obtenu un score de 73,3 % à l’American Invitational Mathematics Examination (AIME) et de 74,2 % sur la référence scientifique GPQA Diamond. Ces résultats montrent des améliorations nettes par rapport aux précédents modèles d’IA et soulignent la force croissante de Google dans le domaine du raisonnement avancé.

« Nous pionnierons ces systèmes de planification depuis plus de dix ans, avec des programmes comme AlphaGo, et il est excitant de voir la puissante combinaison de ces idées avec les modèles fondamentaux les plus performants », a déclaré Demis Hassabis, PDG de Google DeepMind, dans un post sur X.com (anciennement Twitter).

Gemini 2.0 Flash Thinking établit des records avec un traitement de million de tokens

La caractéristique la plus frappante de ce modèle est sa capacité à traiter jusqu’à un million de tokens de texte — cinq fois plus que le modèle o1 Pro d’OpenAI — tout en conservant des temps de réponse plus rapides. Cet élargissement de la fenêtre contextuelle permet au modèle d’analyser plusieurs articles de recherche ou ensembles de données volumineuses simultanément, une capacité qui pourrait transformer la manière dont les chercheurs et les analystes travaillent avec des volumes élevés d’informations.

« En tant qu’expérimentation initiale, j’ai pris divers textes religieux et philosophiques et demandé à Gemini 2.0 Flash Thinking de les tisser ensemble, extrayant des idées nouvelles et uniques », a déclaré Dan Mac, un chercheur en IA ayant testé le modèle, dans un post sur X.com. « Il a traité 970 000 tokens au total. Le résultat est assez incroyable. »

Cette mise à jour intervient à un moment crucial dans l’évolution de l’industrie de l’IA. OpenAI a récemment annoncé son modèle o3, qui a obtenu un score de 87,7 % sur le benchmark GPQA Diamond. Cependant, la décision de Google d’offrir son modèle gratuitement pendant la phase de test (avec des limites d’utilisation) pourrait attirer les développeurs et les entreprises à la recherche d’alternatives à l’abonnement de 200 $ par mois proposé par OpenAI.

Les résultats de référence montrent que le dernier modèle Gemini 2.0 Flash Thinking de Google dépasse nettement les versions antérieures dans les tâches de mathématiques, de sciences et de raisonnement. (Crédit : Google DeepMind)

Google propose Gemini 2.0 Flash Thinking gratuit avec exécution de code intégrée

Jeff Dean, le scientifique en chef de Google DeepMind, a souligné les améliorations apportées à la fiabilité du modèle : « Nous continuons à itérer, avec une fiabilité accrue et moins de contradictions entre les pensées du modèle et ses réponses finales », a-t-il déclaré.

Le modèle inclut également des capacités d’exécution de code natives, permettant aux développeurs d’exécuter et de tester du code directement au sein du système. Cette fonctionnalité, combinée à de meilleures protections contre les contradictions, positionne Gemini 2.0 Flash Thinking comme un concurrent sérieux tant pour la recherche que pour des applications commerciales.

Les analystes du secteur notent que l’accent mis par Google sur l’explication de son processus de raisonnement pourrait aider à répondre aux préoccupations croissantes concernant la transparence et la fiabilité des IA. Contrairement aux modèles traditionnels « boîte noire », Gemini 2.0 Flash Thinking montre ses étapes, facilitant ainsi la compréhension et la vérification de ses conclusions par les utilisateurs.

La transparence de l’IA devient le nouveau champ de bataille alors que Google défie OpenAI

Le modèle a déjà pris la première place au classement du Chatbot Arena, une référence importante pour la performance de l’IA, se distinguant dans des catégories telles que les défis difficiles, le codage et l’écriture créative.

Cependant, des questions demeurent sur la performance et les limitations réelles du modèle. Bien que les scores de référence offrent des métriques précieuses, ils ne se traduisent pas toujours directement par des applications pratiques. Le défi pour Google sera de convaincre les entreprises que son offre gratuite peut égaler ou dépasser les capacités d’alternatives premium.

Alors que la course à l’IA s’intensifie, la dernière sortie de Google semble suggérer un changement de stratégie : allier capacités avancées et accessibilité. Reste à savoir si cette approche permettra de réduire l’écart avec OpenAI, mais elle offre certainement aux décideurs techniques une raison convaincante de reconsidérer leurs partenariats en matière d’IA.

Aujourd’hui, une chose est claire : l’ère d’une IA capable de montrer son raisonnement est là, accessible à quiconque disposant d’un compte Google.

Points à retenir

  • Le modèle Gemini 2.0 Flash Thinking permet de traiter un million de tokens, optimisant ainsi l’analyse de données volumineuses.
  • Des fonctionnalités d’exécution de code intégrées facilitent le travail des développeurs au sein du système.
  • La transparence du modèle pourrait rassurer les utilisateurs face aux préoccupations concernant l’IA.

En somme, cette mise à jour de Google illustre une tendance de fond vers une IA plus ouverte et accessible, invitant à une réflexion sur l’importance de la transparence dans le secteur technologique. Cette question pourrait devenir essentielle à mesure que le marché se développe et que les entreprises cherchent à adopter des solutions d’intelligence artificielle de confiance.




Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *