Google présente Gemma 4, sa famille de modèles open source la plus performante à ce jour. Les quatre nouveaux modèles seront compatibles avec des dispositifs allant des smartphones aux stations de travail, et sont publiés sous une licence entièrement ouverte pour la première fois.
Selon Google, les modèles reposent sur la même technologie que le modèle propriétaire Gemini 3. Ils sont publiés sous la licence Apache-2.0, qui permet aux développeurs de contrôler entièrement les données, l’infrastructure et les modèles. C’est un tournant significatif par rapport aux versions précédentes de Gemma, qui étaient soumises à une licence plus restrictive de Google.
Tous les modèles de Gemma 4 présentent des améliorations notables en matière de raisonnement avancé et de tâches mathématiques. Ils supportent nativement le Function-Calling, la sortie JSON structurée et les instructions système, permettant aux agents autonomes d’interagir avec divers outils et API.
Quatre modèles pour des usages variés
Gemma 4 comprend quatre tailles : Effective 2B (E2B), Effective 4B (E4B), un modèle Mixture-of-Experts de 26B (MoE) et un modèle Dense de 31B. Toutes les variantes sont conçues pour aller au-delà des simples fonctions de chat, maîtrisant une logique complexe ainsi que des flux de travail agentiques.
| E2B | E4B | 26B MoE | 31B Dense | |
|---|---|---|---|---|
| Paramètres actifs | 2 milliards | 4 milliards | 3,8 milliards | — |
| Architecture | — | — | MoE | Dense |
| Fenêtre de contexte | 128 000 tokens | 128 000 tokens | jusqu’à 256 000 tokens | jusqu’à 256 000 tokens |
| Matériel cible | Smartphones, Raspberry Pi, Jetson Orin Nano | Smartphones, Raspberry Pi, Jetson Orin Nano | PC personnels, GPU de consommation, stations de travail, accélérateurs | PC personnels, GPU de consommation, stations de travail, accélérateurs |
| Fonctionnement hors ligne | ✅ | ✅ | ✅ | ✅ |
| Vision (images/vidéos) | ✅ | ✅ | ✅ | ✅ |
| Entrée audio | ✅ | ✅ | — | — |
| Quantisé sur GPU de consommation | — | — | ✅ | ✅ |
| Classement Arena-AI (ouvert) | — | — | #6 | #3 |
| Caractéristique | Efficacité de calcul et de stockage sur appareils Edge | Efficacité de calcul et de stockage sur appareils Edge | Focus sur la latence, 3,8 milliards de paramètres actifs, génération rapide de tokens | Qualité maximale, base pour un fine-tuning efficace |
Actuellement, selon Google, le modèle de 31B occupe la troisième place parmi tous les modèles open source sur le classement d’Arena-AI, tandis que le modèle MoE de 26B se classe sixième. Ces modèles surpassent même des versions 20 fois plus volumineuses. Pour les développeurs, cela signifie des résultats performants avec un besoin en matériel réduit.
Disponibilité et plateformes supportées
Gemma 4 est disponible dès maintenant sur Hugging Face, Kaggle et Ollama. Google AI Studio prend en charge les modèles de 31B et 26B, tandis que la Google AI Edge Gallery propose les variantes E4B et E2B.
Au lancement, plusieurs frameworks et plateformes sont compatibles, notamment Hugging Face Transformers, vLLM, llama.cpp, MLX, Ollama, ainsi que des GPU de NVIDIA variés. Le fine-tuning peut s’effectuer via Google Colab, Vertex AI ou des GPU de jeu locaux.
Points à retenir
- Gemma 4 introduit un profond changement dans la stratégie de Google avec des modèles sous licence open source.
- Les modèles sont conçus pour offrir des calculs efficaces sur une variété de plateformes.
- Un choix de modèles adaptés à des usages allant du mobile aux serveurs, démontrant une grande flexibilité.
- Les performances des modèles surpassent des concurrents plus volumineux, ce qui est significatif pour les développeurs.
- Un large éventail de frameworks est supporté pour faciliter l’intégration et le déploiement.
En examinant les innovations de Gemma 4, je suis frappé par l’impact potentiel de ces modèles sur notre approche de l’IA. L’accessibilité qu’offre cette technologie pourrait bien redéfinir les normes d’utilisation de l’IA et provoquer des changements significatifs dans de nombreux secteurs. C’est un véritable moment d’évolution, et en tant que passionné de technologie, j’y vois des possibilités fascinantes. Quelles seront vos attentes et vos réflexions sur ces avancées ?