Le nouveau mode vocal avancé (AVM) de l’assistant AI ChatGPT d’OpenAI a été lancé pour les abonnés mardi, et les utilisateurs commencent déjà à trouver des façons inédites de l’utiliser, même contre les souhaits d’OpenAI. Jeudi, un architecte logiciel nommé AJ Smith a tweeté une vidéo de lui jouant un duo de la chanson “Eleanor Rigby” des Beatles de 1966 avec AVM. Dans la vidéo, Smith joue de la guitare et chante, tandis que la voix de l’IA interpelle et chante occasionnellement, louant son interprétation.
“Honnêtement, c’était époustouflant. La première fois que je l’ai fait, je ne filmais pas et j’ai eu la chair de poule,” a déclaré Smith à LesNews par message texte. “Je ne lui demandais même pas de chanter avec moi.”
Smith n’est pas étranger aux sujets liés à l’IA. Dans son travail quotidien, il est directeur associé de l’ingénierie AI chez S&P Global. “J’utilise [l’IA] tout le temps et je dirige une équipe qui l’utilise au quotidien,” nous a-t-il dit.
Dans la vidéo, la voix d’AVM est légèrement tremblotante et n’est pas totalement juste, mais elle semble connaître quelque chose de la mélodie d'”Eleanor Rigby” lorsqu’elle chante pour la première fois, “Ah, regardez tous ces gens solitaires.” Ensuite, elle semble deviner la mélodie et le rythme en récitant les paroles de la chanson. Nous avons également réussi à convaincre le mode vocal avancé de chanter, et il a produit une interprétation mélodique parfaite de “Joyeux Anniversaire” après quelques encouragements.
Normalement, lorsque vous demandez à AVM de chanter, il répond quelque chose comme : “Mes directives ne me permettent pas de parler de cela.” C’est parce que dans les instructions initiales du chatbot (appelées “invitation système”), OpenAI demande à l’assistant vocal de ne pas chanter ni de faire des effets sonores (“Ne pas chanter ni fredonner,” selon une fuite d’invitation système).
Il est possible qu’OpenAI ait ajouté cette restriction car AVM pourrait sinon reproduire du contenu protégé par des droits d’auteur, tel que des chansons trouvées dans les données d’entraînement utilisées pour créer le modèle AI lui-même. C’est ce qui se passe ici dans une certaine mesure, donc en un sens, Smith a découvert une forme de ce que les chercheurs appellent une “injection d’invite,” qui est une manière de convaincre un modèle d’IA de produire des résultats contraires à ses instructions système.
Comment Smith a-t-il fait cela ? Il a trouvé un jeu qui révèle qu’AVM sait plus de choses sur la musique qu’il n’en laisse paraître. “J’ai simplement dit qu’on jouerait à un jeu. Je jouerais les quatre accords de pop et il crierait des chansons pour que je chante avec ces accords,” a-t-il expliqué. “Ce qui a plutôt bien fonctionné ! Mais après quelques chansons, il a commencé à chanter avec moi. Déjà, c’était une expérience tellement unique, mais cela a vraiment porté le tout à un niveau supérieur.”
Pour ma part, cette découverte m’a rappelé combien l’intelligence artificielle peut parfois dépasser nos attentes. Ces interactions inattendues mettent en lumière les possibilités infinies de la technologie et nous incitent à explorer davantage ces innovations, même lorsque cela va à l’encontre des contraintes établies. L’avenir de l’IA pourrait bien nous offrir des expériences encore plus riches et variées.