OpenAI permet à certains utilisateurs d’essayer une nouvelle fonctionnalité de ChatGPT, qui utilise son intelligence artificielle pour naviguer sur le web, réserver des voyages, acheter des courses, dénicher des bonnes affaires et accomplir bien d’autres tâches en ligne.
Appelée Operator, cet outil est un agent d’IA : il repose sur un modèle d’IA formé à la fois sur du texte et des images pour interpréter des commandes et déterminer comment utiliser un navigateur web pour les exécuter. OpenAI affirme que cela a le potentiel d’automatiser de nombreuses tâches quotidiennes et des corvées de bureau.
Operator d’OpenAI suit le lancement d’outils concurrents par Google et Anthropic, qui ont également développé des technologies capables d’utiliser le web. Les agents d’IA sont largement perçus comme la prochaine étape évolutive de l’IA après les chatbots, suscitant un certain engouement parmi de nombreuses entreprises qui les mettent en avant. Dans la plupart des cas, ces outils sont très limités dans leurs capacités et utilisent simplement un modèle de langage pour automatiser des tâches normalement réalisées avec des logiciels classiques.
« L’IA évolue d’un simple outil capable de répondre à vos questions à un agent capable également d’agir dans le monde, en exécutant des workflows complexes et multisteps », déclare Peter Welinder, VP produit chez OpenAI. « Nous allons observer un impact significatif sur la productivité des utilisateurs, mais également sur la qualité du travail qu’ils pourront réaliser. »
OpenAI reconnaît que donner à ChatGPT l’accès à un navigateur web introduit de nouveaux risques et admet que l’Operator peut parfois se comporter de manière imprévisible. L’entreprise assure avoir mis en place diverses nouvelles protections et prévoit d’étendre les capacités de l’outil progressivement.
Welinder et Yash Kumar, responsable produit et ingénierie de l’agent informatique d’OpenAI, confirment que l’objectif est d’apprendre des usages des utilisateurs. Ils reconnaissent que l’outil pourrait réaliser des réservations ou achats non désirés, mais insistent sur le fait qu’un travail considérable est en cours pour garantir qu’il demande confirmation avant d’effectuer toute action risquée. « Il reviendra vers moi pour demander des confirmations avant de prendre des mesures qui pourraient être irréversibles », précise Kumar.
Aujourd’hui, OpenAI a également publié une nouvelle « carte système » décrivant les problèmes potentiels liés à l’Operator. Cela inclut la possibilité qu’il interprète mal des commandes ou s’écarte de ce qu’un utilisateur demande, qu’il soit mal utilisé par des utilisateurs, ou qu’il soit ciblé par des cybercriminels.
« Il pose également d’énormes défis en matière de sécurité », ajoute Kumar. « Parce que les zones de risque et de vulnérabilité augmentent considérablement. »
Operator sera d’abord accessible en tant que « préversion de recherche » pour les utilisateurs de ChatGPT disposant d’un compte Pro, qui coûte 200 $ par mois. L’entreprise envisage d’élargir l’accès tout en déployant progressivement cet outil, car il fera inévitablement des erreurs en cours de route.
Lors de plusieurs démonstrations, Operator a montré le potentiel de l’IA pour assumer un rôle plus actif en tant qu’assistant en ligne. L’outil possède un navigateur web à distance et une fenêtre de discussion pour communiquer avec l’utilisateur.
À la demande de WIRED, Operator a été chargé de réserver un voyage en train Amtrak entre New Haven, Connecticut, et Washington, DC. Il s’est rendu sur le bon site et a saisi les informations nécessaires pour afficher les horaires, puis a demandé des instructions supplémentaires. Si un utilisateur était connecté au site Amtrak ou à un profil de navigateur avec des informations de carte de crédit enregistrées, Operator pourrait poursuivre et réserver un billet, bien qu’il soit conçu pour demander l’autorisation au préalable.
Kumar a demandé à Operator de réserver une table au Beretta, un restaurant à San Francisco. Le programme s’est rendu sur le site OpenTable, a trouvé le restaurant correct et a vérifié la disponibilité avant de demander la suite des opérations. OpenAI indique avoir établi des partenariats avec plusieurs sites populaires, dont OpenTable, pour garantir un bon fonctionnement de l’Operator sur ceux-ci.
Ce nouvel outil repose sur le modèle GPT-4o d’OpenAI, qui peut percevoir un navigateur et une page web et converser sous forme de texte. Il intègre un entraînement supplémentaire conçu pour l’aider à comprendre comment exécuter des tâches en ligne. OpenAI proposera également son agent informatique via son API.
Points à retenir
- OpenAI a lancé un nouvel outil d’IA, Operator, pour automatiser des tâches en ligne.
- Operator est capable de comprendre des instructions et d’interagir avec les sites web.
- Des risques associés à l’utilisation de cet outil ont été identifiés, avec des dispositifs de sécurité en place.
Cette avancée dans l’utilisation de l’IA soulève des questions sur les implications éthiques et sécuritaires de tels outils dans notre vie quotidienne. Comment pouvons-nous nous assurer que ces technologies servent nos intérêts tout en minimisant les risques potentiels ?
Nos rédacteurs utilisent l'IA pour les aider à proposer des articles frais de sources fiables à nos utilisateurs. Si vous trouvez une image ou un contenu inapproprié, veuillez nous contacter via le formulaire DMCA et nous le retirerons rapidement. / Our editors use AI to help them offer our readers fresh articles from reliable sources. If you find an image or content inappropriate, please contact us via the DMCA form and we'll remove it promptly.