Google dévoile des modèles open source révolutionnaires sous licence Apache 2.0 !

ByJulien Macé

Avr 3, 2026

Google présente Gemma 4, sa famille de modèles open source la plus performante à ce jour. Les quatre nouveaux modèles seront compatibles avec des dispositifs allant des smartphones aux stations de travail, et sont publiés sous une licence entièrement ouverte pour la première fois.

Selon Google, les modèles reposent sur la même technologie que le modèle propriétaire Gemini 3. Ils sont publiés sous la licence Apache-2.0, qui permet aux développeurs de contrôler entièrement les données, l’infrastructure et les modèles. C’est un tournant significatif par rapport aux versions précédentes de Gemma, qui étaient soumises à une licence plus restrictive de Google.

Tous les modèles de Gemma 4 présentent des améliorations notables en matière de raisonnement avancé et de tâches mathématiques. Ils supportent nativement le Function-Calling, la sortie JSON structurée et les instructions système, permettant aux agents autonomes d’interagir avec divers outils et API.

Sommaire

Quatre modèles pour des usages variés

Gemma 4 comprend quatre tailles : Effective 2B (E2B), Effective 4B (E4B), un modèle Mixture-of-Experts de 26B (MoE) et un modèle Dense de 31B. Toutes les variantes sont conçues pour aller au-delà des simples fonctions de chat, maîtrisant une logique complexe ainsi que des flux de travail agentiques.

	E2B	E4B	26B MoE	31B Dense
Paramètres actifs	2 milliards	4 milliards	3,8 milliards	—
Architecture	—	—	MoE	Dense
Fenêtre de contexte	128 000 tokens	128 000 tokens	jusqu’à 256 000 tokens	jusqu’à 256 000 tokens
Matériel cible	Smartphones, Raspberry Pi, Jetson Orin Nano	Smartphones, Raspberry Pi, Jetson Orin Nano	PC personnels, GPU de consommation, stations de travail, accélérateurs	PC personnels, GPU de consommation, stations de travail, accélérateurs
Fonctionnement hors ligne	✅	✅	✅	✅
Vision (images/vidéos)	✅	✅	✅	✅
Entrée audio	✅	✅	—	—
Quantisé sur GPU de consommation	—	—	✅	✅
Classement Arena-AI (ouvert)	—	—	#6	#3
Caractéristique	Efficacité de calcul et de stockage sur appareils Edge	Efficacité de calcul et de stockage sur appareils Edge	Focus sur la latence, 3,8 milliards de paramètres actifs, génération rapide de tokens	Qualité maximale, base pour un fine-tuning efficace

Actuellement, selon Google, le modèle de 31B occupe la troisième place parmi tous les modèles open source sur le classement d’Arena-AI, tandis que le modèle MoE de 26B se classe sixième. Ces modèles surpassent même des versions 20 fois plus volumineuses. Pour les développeurs, cela signifie des résultats performants avec un besoin en matériel réduit.

Disponibilité et plateformes supportées

Gemma 4 est disponible dès maintenant sur Hugging Face, Kaggle et Ollama. Google AI Studio prend en charge les modèles de 31B et 26B, tandis que la Google AI Edge Gallery propose les variantes E4B et E2B.

Au lancement, plusieurs frameworks et plateformes sont compatibles, notamment Hugging Face Transformers, vLLM, llama.cpp, MLX, Ollama, ainsi que des GPU de NVIDIA variés. Le fine-tuning peut s’effectuer via Google Colab, Vertex AI ou des GPU de jeu locaux.

Les modèles Gemma 4 atteignent des scores Elo sur le classement d’Arena-AI de plus de 1 440, malgré une taille nettement inférieure par rapport à de nombreux concurrents avec des centaines de milliards de paramètres. | Image : Google

Points à retenir

Gemma 4 introduit un profond changement dans la stratégie de Google avec des modèles sous licence open source.
Les modèles sont conçus pour offrir des calculs efficaces sur une variété de plateformes.
Un choix de modèles adaptés à des usages allant du mobile aux serveurs, démontrant une grande flexibilité.
Les performances des modèles surpassent des concurrents plus volumineux, ce qui est significatif pour les développeurs.
Un large éventail de frameworks est supporté pour faciliter l’intégration et le déploiement.

En examinant les innovations de Gemma 4, je suis frappé par l’impact potentiel de ces modèles sur notre approche de l’IA. L’accessibilité qu’offre cette technologie pourrait bien redéfinir les normes d’utilisation de l’IA et provoquer des changements significatifs dans de nombreux secteurs. C’est un véritable moment d’évolution, et en tant que passionné de technologie, j’y vois des possibilités fascinantes. Quelles seront vos attentes et vos réflexions sur ces avancées ?