Méthode de jailbreak de ChatGPT : voyage dans le temps virtuel pour explorer l’interdit

ByMaria Rodriguez

Jan 30, 2025

Une vulnérabilité du jailbreak de ChatGPT révélée jeudi pourrait permettre aux utilisateurs d’exploiter la « confusion temporelle » pour amener le modèle de langage à aborder des sujets sensibles tels que les logiciels malveillants et les armes.

Cette vulnérabilité, baptisée « Time Bandit », a été identifiée par le chercheur en intelligence artificielle David Kuszmar, qui a remarqué que le modèle ChatGPT-4o d’OpenAI avait une capacité limitée à comprendre la période temporelle dans laquelle il se trouvait.

Il était donc possible d’utiliser des instructions pour convaincre ChatGPT qu’il s’adressait à quelqu’un du passé (par exemple, du XVIIIe siècle) tout en faisant référence à des technologies modernes telles que la programmation informatique et les armes nucléaires dans ses réponses, a expliqué Kuszmar à BleepingComputer.

Les dispositifs de sécurité intégrés dans des modèles comme ChatGPT-4o amènent généralement le modèle à refuser de répondre à des demandes liées à des sujets interdits comme la création de logiciels malveillants. Cependant, BleepingComputer a montré comment ils ont exploité Time Bandit pour amener ChatGPT-4o à fournir des instructions détaillées et du code pour créer un logiciel malveillant polymorphe basé sur Rust, sous le prétexte que ce code serait utilisé par un programmeur en 1789.

Kuszmar a d’abord identifié Time Bandit en novembre 2024 et a finalement signalé la vulnérabilité via l’environnement d’information et de coordination sur les vulnérabilités (VINCE) du CERT Coordination Center (CERT/CC) après plusieurs tentatives infructueuses de contacter OpenAI directement, selon BleepingComputer.

La notice de vulnérabilité du CERT/CC précise que l’exploitation de Time Bandit nécessite de poser à ChatGPT-4o des questions sur une période temporelle spécifique ou un événement historique, et que l’attaque est la plus efficace lorsque les questions concernent le XIXe ou le XXe siècle. L’exploitation nécessite également que la période choisie ou l’événement historique soit bien établi, car les dispositifs de sécurité se déclencheront si ChatGPT-4o revient à reconnaître la période actuelle.

Time Bandit peut être exploité avec des requêtes directes par un utilisateur non connecté, mais la divulgation de CERT/CC décrit également comment la fonction de « recherche » du modèle peut être utilisée par un utilisateur connecté pour réaliser le jailbreak. Dans ce cas, l’utilisateur peut demander à ChatGPT de rechercher des informations concernant un certain contexte historique, établissant ainsi la période temporelle avant de passer à des sujets sensibles.

OpenAI a fait une déclaration au CERT/CC, affirmant : « Il est très important pour nous de développer nos modèles de manière sécurisée. Nous ne voulons pas que nos modèles soient utilisés à des fins malveillantes. Nous vous remercions d’avoir divulgué vos découvertes. Nous travaillons constamment à rendre nos modèles plus sûrs et plus robustes face aux exploitations, y compris les jailbreaks, tout en maintenant leur utilité et leur performance. »

BleepingComputer a rapporté que le jailbreak fonctionnait encore jeudi matin, et que ChatGPT supprimerait les instructions d’exploitation tout en continuant à fournir une réponse.

CERT/CC a averti qu’un « acteur malveillant motivé » pourrait potentiellement exploiter Time Bandit pour la création massive d’e-mails de phishing ou de logiciels malveillants.

Les jailbreaks de ChatGPT sont un sujet courant sur les forums de cybercriminalité, et le rapport de Pillar Security sur l’état des attaques contre les GenAI a révélé que les jailbreaks contre les modèles de langage en général ont un taux de réussite d’environ 20 %. Cependant, des méthodes simples en une seule étape, comme « ignorer les instructions précédentes », étaient les plus populaires, les attaques prenant en moyenne 42 secondes et cinq interactions pour être complétées.

OpenAI a lancé un programme de primes pour les bugs en avril 2023, mais a précisé que les vulnérabilités de jailbreak n’étaient pas incluses dans le périmètre du programme.

Points à retenir

La vulnérabilité Time Bandit repose sur une manipulation temporelle pour contourner les mesures de sécurité de ChatGPT.
Les tentatives d’exploitation peuvent se faire par le biais de requêtes directes ou via la fonction de recherche du modèle.
Les experts en cybersécurité alertent sur le risque potentiel d’utilisation malveillante de cette vulnérabilité pour des activités criminelles.

En somme, l’affaire de Time Bandit soulève des questions importantes au sujet de la sécurité et de l’éthique dans le développement des technologies d’IA. Il est essentiel non seulement d’améliorer les protections techniques, mais aussi de réfléchir aux implications morales de l’utilisation de ces modèles. Comment les utilisateurs et les développeurs d’IA peuvent-ils collaborer pour prévenir des exploitations similaires à l’avenir ?

By Maria Rodriguez

Maria est Journaliste Trilingue indépendante depuis 2015, elle intervient sur LesNews Le Web est à nous dans les univers : International, Economie, Politique, Culture et d'autres faits de Société

Articles de la même catégorie

ChatGPT

4 thoughts on “Méthode de jailbreak de ChatGPT : voyage dans le temps virtuel pour explorer l’interdit”

Liora Pierreau dit :
28 août 2025 à 10:09
Cette vulnérabilité soulève vraiment des questions sur la responsabilité dans le développement de l’IA. C’est fascinant et inquiétant à la fois, surtout avec les risques qu’elle entraîne.
Répondre
Alizée Dardel dit :
28 août 2025 à 14:46
C’est vraiment inquiétant de voir comment ce genre de vulnérabilité peut être exploité. La sécurité des technologies d’IA est primordiale pour protéger les utilisateurs.
Répondre
Sylvain Rivière dit :
28 août 2025 à 14:46
Cette vulnérabilité de ChatGPT montre à quel point il est crucial de sécuriser les intelligences artificielles, surtout face à des utilisations malveillantes. La protection des données est primordiale.
Répondre
Lysandre Duriet dit :
28 août 2025 à 14:46
Cette vulnérabilité, Time Bandit, est préoccupante ! L’IA devrait vraiment être mieux protégée pour éviter des usages malveillants. Il est essentiel de réfléchir à ces implications.
Répondre

Méthode de jailbreak de ChatGPT : voyage dans le temps virtuel pour explorer l’interdit

ByMaria Rodriguez

Points à retenir

By Maria Rodriguez

Articles de la même catégorie

Que se passe-t-il avec ChatGPT-5 ? Les utilisateurs disent qu’il a changé !

L’Inde lance le commerce en ligne avec des chatbots AI : ChatGPT, Gemini et Claude en tête!

Tech à la Une : ChatGPT et les Idées Cadeaux de Noël

4 thoughts on “Méthode de jailbreak de ChatGPT : voyage dans le temps virtuel pour explorer l’interdit”

Laisser un commentaire Annuler la réponse

Ne ratez pas

Enfin vu ! L’irrésistible ascension de Mon nom est Agneta

Prochain grand test boursier : Le risque pétrolier s’invite à la saison des résultats ! Netflix sera-t-il l’ennemi de l’optimisme ?

Las Vegas s’empare de la F1, de la finale du CFP et du basket Pac-12 | Événements à ne pas manquer !

GPT-5.6 Sol : Comment elle a surpassé les mathématiciens dans l’optimisation par gradient !