sam. Juin 13th, 2026

Google présente Gemma 4, sa famille de modèles open source la plus performante à ce jour. Les quatre nouveaux modèles seront compatibles avec des dispositifs allant des smartphones aux stations de travail, et sont publiés sous une licence entièrement ouverte pour la première fois.

Selon Google, les modèles reposent sur la même technologie que le modèle propriétaire Gemini 3. Ils sont publiés sous la licence Apache-2.0, qui permet aux développeurs de contrôler entièrement les données, l’infrastructure et les modèles. C’est un tournant significatif par rapport aux versions précédentes de Gemma, qui étaient soumises à une licence plus restrictive de Google.

Tous les modèles de Gemma 4 présentent des améliorations notables en matière de raisonnement avancé et de tâches mathématiques. Ils supportent nativement le Function-Calling, la sortie JSON structurée et les instructions système, permettant aux agents autonomes d’interagir avec divers outils et API.

Quatre modèles pour des usages variés

Gemma 4 comprend quatre tailles : Effective 2B (E2B), Effective 4B (E4B), un modèle Mixture-of-Experts de 26B (MoE) et un modèle Dense de 31B. Toutes les variantes sont conçues pour aller au-delà des simples fonctions de chat, maîtrisant une logique complexe ainsi que des flux de travail agentiques.

E2B E4B 26B MoE 31B Dense
Paramètres actifs 2 milliards 4 milliards 3,8 milliards
Architecture MoE Dense
Fenêtre de contexte 128 000 tokens 128 000 tokens jusqu’à 256 000 tokens jusqu’à 256 000 tokens
Matériel cible Smartphones, Raspberry Pi, Jetson Orin Nano Smartphones, Raspberry Pi, Jetson Orin Nano PC personnels, GPU de consommation, stations de travail, accélérateurs PC personnels, GPU de consommation, stations de travail, accélérateurs
Fonctionnement hors ligne
Vision (images/vidéos)
Entrée audio
Quantisé sur GPU de consommation
Classement Arena-AI (ouvert) #6 #3
Caractéristique Efficacité de calcul et de stockage sur appareils Edge Efficacité de calcul et de stockage sur appareils Edge Focus sur la latence, 3,8 milliards de paramètres actifs, génération rapide de tokens Qualité maximale, base pour un fine-tuning efficace

Actuellement, selon Google, le modèle de 31B occupe la troisième place parmi tous les modèles open source sur le classement d’Arena-AI, tandis que le modèle MoE de 26B se classe sixième. Ces modèles surpassent même des versions 20 fois plus volumineuses. Pour les développeurs, cela signifie des résultats performants avec un besoin en matériel réduit.

Disponibilité et plateformes supportées

Gemma 4 est disponible dès maintenant sur Hugging Face, Kaggle et Ollama. Google AI Studio prend en charge les modèles de 31B et 26B, tandis que la Google AI Edge Gallery propose les variantes E4B et E2B.

Au lancement, plusieurs frameworks et plateformes sont compatibles, notamment Hugging Face Transformers, vLLM, llama.cpp, MLX, Ollama, ainsi que des GPU de NVIDIA variés. Le fine-tuning peut s’effectuer via Google Colab, Vertex AI ou des GPU de jeu locaux.

Les modèles Gemma 4 atteignent des scores Elo sur le classement d’Arena-AI de plus de 1 440, malgré une taille nettement inférieure par rapport à de nombreux concurrents avec des centaines de milliards de paramètres. | Image : Google

Points à retenir

  • Gemma 4 introduit un profond changement dans la stratégie de Google avec des modèles sous licence open source.
  • Les modèles sont conçus pour offrir des calculs efficaces sur une variété de plateformes.
  • Un choix de modèles adaptés à des usages allant du mobile aux serveurs, démontrant une grande flexibilité.
  • Les performances des modèles surpassent des concurrents plus volumineux, ce qui est significatif pour les développeurs.
  • Un large éventail de frameworks est supporté pour faciliter l’intégration et le déploiement.

En examinant les innovations de Gemma 4, je suis frappé par l’impact potentiel de ces modèles sur notre approche de l’IA. L’accessibilité qu’offre cette technologie pourrait bien redéfinir les normes d’utilisation de l’IA et provoquer des changements significatifs dans de nombreux secteurs. C’est un véritable moment d’évolution, et en tant que passionné de technologie, j’y vois des possibilités fascinantes. Quelles seront vos attentes et vos réflexions sur ces avancées ?


Partager : X Facebook WhatsApp LinkedIn Reddit

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *