dim. Juin 21st, 2026

Dans une annonce surprise survenue tard dans la nuit, Xiaomi a officiellement dévoilé sa très attendue série MiMo-V2, une nouvelle génération de modèles d’intelligence artificielle développée en interne. Composée de trois versions spécialisées : MiMo-V2-Pro, MiMo-V2-Omni, et MiMo-V2-TTS, cette série marque l’ambitieux virage de Xiaomi vers la « Nouvelle ère des agents » en intelligence artificielle.

Bien que les intégrations natives des applications comme Xiaomi Browser et Kingsoft Office soient pour le moment limitées au marché chinois, ces modèles sont entièrement basés sur le web, permettant ainsi aux développeurs et passionnés du monde entier de découvrir leurs capacités via le site officiel ou directement à travers Xiaomi MiMo Studio.

Analyse technique de la série MiMo-V2

Ce récent lancement de Xiaomi ne constitue pas simplement un petit pas en avant ; les résultats des tests montrent que ces modèles sont conçus pour rivaliser avec les meilleurs de l’industrie de l’IA.

Xiaomi MiMo-V2-Pro : Le modèle phare

Destiné aux flux de travail complexes nécessitant peu d’intervention humaine, le modèle Pro se distingue par sa puissance en matière de raisonnement logique et de planification des tâches.

  • Spécifications techniques : Ce modèle affiche un impressionnant total d’1 trillion (1T) de paramètres, avec 42 milliards (42B) activés lors de l’inférence. Grâce à une architecture d’attention innovante, il prend en charge une fenêtre contextuelle ultra-longue de 1 million de jetons.

  • Résultats des benchmarks : Testé sous le nom de code “Hunter Alpha”, ce modèle a récemment franchi la barre d’1T de jetons utilisés. Dans le rigoureux banc d’essai Claw-Eval, le MiMo-V2-Pro a atteint un score moyen de 75,7, se plaçant ainsi parmi les trois premiers au niveau mondial, juste derrière le Claude Opus 4.6 d’Anthropic.

  • Code et exécution : Selon les retours des ingénieurs, ses capacités de codage, de conception de systèmes et de génération élégante de code se rapprochent de celles du Claude Opus 4.6, mais à une fraction du coût de l’API.

Xiaomi MiMo-V2-Omni : La solution multimodale

Le modèle Omni est la réponse de Xiaomi à la compréhension multimodale, traitant nativement les entrées d’image, de vidéo, d’audio et de texte.

  • Succès dans les tests : Évalué sous le nom de code “Healer Alpha”, ce modèle a dominé le classement PinchBench, surpassant de grands noms comme Gemini 3 Pro et Claude Opus 4.6 dans des domaines clés :

    • Raisonnement audio : Score de 94,0.
    • Compréhension audio : Leader avec un score de 69,4.
    • Prévisions d’événements vidéo : À la pointe avec 66,7.
  • Application pratique : Ce modèle peut autonomement développer et exécuter des plans dans diverses modalités, ajustant ses politiques en temps réel face à des anomalies.

Xiaomi MiMo-V2-TTS : La voix de l’agent

Pour compléter les modèles de raisonnement, Xiaomi a présenté un modèle de synthèse vocale de pointe, reposant sur un tokeniseur audio développé en interne.

  • Contrôle réaliste : Ce modèle TTS, entraîné sur des centaines de millions d’heures de données audio, offre un contrôle émotionnel précis, capable d’effectuer des transitions de ton en plein milieu d’une phrase et de synthétiser plusieurs dialectes régionaux.

Disponibilité et tarification de l’API

Avec une architecture basée sur le web, l’accès à ces modèles est très simple. Bien que certaines intégrations s’adressent principalement au marché chinois, les modèles sont accessibles à l’échelle mondiale.

Xiaomi a mis l’API à disposition dès maintenant à un tarif compétitif :

  • MiMo-V2-Pro :
    • Pour un contexte de 256K : 1,00 $ / 1M de jetons d’entrée | 3,00 $ / 1M de jetons de sortie
    • Pour un contexte de 1M : 2,00 $ / 1M de jetons d’entrée | 6,00 $ / 1M de jetons de sortie
  • MiMo-V2-Omni : à confirmer.

Note : Pour une durée limitée, les développeurs peuvent tester ces modèles gratuitement pendant une semaine.

Vision à long terme de Xiaomi

Ce lancement nocturne souligne l’engagement de Xiaomi à établir un écosystème logiciel solide. En offrant des performances comparables à celles de Claude Opus 4.6 pour environ 20% du coût, Xiaomi facilite considérablement l’accès à l’IA de pointe.

Points à retenir

  • Xiaomi dévoile une série de modèles d’IA avec des applications variées.
  • Le MiMo-V2-Pro se positionne comme un acteur de choix pour des tâches complexes.
  • Le modèle Omni offre une approche multimodale efficace.
  • Le modèle TTS permet une synthèse vocale avancée et expressive.
  • Les coûts d’intégration sont compétitifs pour les développeurs.

Dans un monde où l’intelligence artificielle évolue rapidement, ces lancements posent question. Comment Xiaomi parviendra-t-il à se démarquer face à des géants établis ? L’essor de l’IA domestique pose également des défis éthiques et techniques qu’il faudra surveiller de près dans les années à venir.


Partager : X Facebook WhatsApp LinkedIn Reddit

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *