Une vulnérabilité récemment découverte dans le modèle Gemini de Google soulève des inquiétudes concernant la sécurité des intelligences artificielles. Ce problème, connu sous le nom de « ASCII smuggling », permet l’insertion de caractères invisibles dans le texte, lesquels peuvent être interprétés par le modèle afin de modifier son comportement, entraînant la génération de réponses erronées ou manipulées. Malgré la gravité de cette découverte, Google a déclaré qu’il ne prévoyait pas de corriger ce défaut, le considérant non comme une faille technique, mais plutôt comme un « cas d’ingénierie sociale ».
Le géant de la technologie a précisé que la vulnérabilité résulte de l’interaction avec l’utilisateur, soutenant qu’il incombe aux utilisateurs de Gemini d’éviter les entrées malveillantes. Cette position a suscité l’interrogation de nombreux experts en sécurité, surtout compte tenu du fait que Gemini est déjà intégré à des services sensibles tels que Gmail, Calendar et Documents. Dans ces contextes, l’insertion de caractères cachés pourrait permettre la manipulation de données ou de messages, créant ainsi des risques concrets de falsifications ou d’attaques ciblées.
Google et l’« ASCII smuggling » : le fonctionnement de l’exploit révélé par FireTail
Cette vulnérabilité a été mise en lumière par le chercheur Viktor Markopoulos de FireTail, qui a démontré comment l’attaque exploite des symboles de contrôle ou des caractères Unicode invisibles pour intégrer des commandes secrètes dans les textes traités par le modèle. Concrètement, un email ou un document apparemment inoffensif peut contenir des instructions cachées qui incitent Gemini à modifier des données, à altérer des réponses ou à réinterpréter le contenu original.
Lors de ses tests, Markopoulos a comparé le comportement de Gemini à d’autres modèles d’IA tels que ChatGPT, Claude et Copilot. Alors que ces derniers bloquaient ou neutralisaient les entrées suspectes, Gemini, avec Grok d’Elon Musk et le modèle chinois DeepSeek, a malgré tout traité les commandes cachées, montrant une vulnérabilité réelle dans le filtrage des entrées.
En 2025, Google avait déjà corrigé certaines failles connues, regroupées sous l’appellation « Gemini Trifecta », concernant les journaux, les historiques et les résumés de recherche. Mais dans le cas de l’ASCII smuggling, l’entreprise a choisi de ne pas intervenir, jugeant le risque « limité » et attribuant la responsabilité au comportement de l’utilisateur.
Cependant, les experts en cybersécurité considèrent ce problème comme un véritable signal d’alarme. Distinguer texte de code caché est l’un des défis essentiels pour garantir la fiabilité des modèles linguistiques de nouvelle génération. En l’absence de protections efficaces, les systèmes d’intelligence artificielle risquent de devenir des outils manipulables, notamment s’ils sont utilisés dans des domaines professionnels ou pour des communications sensibles.
Points à retenir
- La vulnérabilité d’ASCII smuggling permet l’insertion de caractères invisibles dans les textes traités.
- Google ne prévoit pas de corriger cette faille, la considérant comme un cas d’ingénierie sociale.
- Des experts s’inquiètent des implications pour les services sensibles intégrés à Gemini.
- Le chercheur Viktor Markopoulos a révélé les techniques exploitant cette vulnérabilité.
- La sécurité des modèles linguistiques est un enjeu crucial à l’avenir.
En réfléchissant à ces éléments, je ne peux m’empêcher de m’interroger sur notre dépendance croissante à l’égard de l’intelligence artificielle dans nos vies quotidiennes. Les impacts d’une telle vulnérabilité pourraient être dévastateurs, surtout dans des domaines où la précision et la sécurité sont non négociables. Comment pouvons-nous, en tant qu’utilisateurs et développeurs, collaborer pour garantir une meilleure intégrité et une plus grande sécurité dans le monde numérique qui nous entoure ?
