En mai, lors de la première démonstration par OpenAI des capacités audio de conversation de ChatGPT-4o, j’avais écrit que nous nous trouvions "au bord de quelque chose… comme un changement radical dans notre façon de penser et de travailler avec les modèles de langage." Maintenant que ces fonctionnalités "Avancée Voix" sont largement déployées pour les abonnés de ChatGPT, nous avons décidé de demander à ChatGPT d’expliquer, avec sa propre voix, comment cette nouvelle méthode d’interaction pourrait affecter notre relation collective avec les modèles de langage.
Cette conversation, que vous pouvez écouter et lire ci-dessous, ne doit pas être considérée comme une interview avec un porte-parole officiel d’OpenAI ou quoi que ce soit du genre. Néanmoins, elle offre une manière ludique de tester les compétences conversationnelles de ChatGPT en direct.
Nous avons été impressionnés par le rythme naturel, oserions-nous dire humain, et la livraison de la voix "Sol" de ChatGPT, qui rappelle un peu Janeane Garofalo des années 90. Grâce à sa capacité à donner des réponses rapides – proposées en millisecondes plutôt qu’en secondes – et à son intonation convaincante, il est incroyablement facile de se laisser tromper en pensant que l’on parle à un être conscient, alors que, comme le dit ChatGPT, "je ne suis toujours qu’un programme informatique traitant des informations, sans émotions réelles ni conscience."
Quelle que soit la conscience que cet agent de traitement de l’information possède ou non, il est facile d’imaginer que des gens formant des relations parasociales intenses avec ces voix fluides à l’autre bout des serveurs d’OpenAI. Cela semble ouvrir une toute nouvelle ère dans notre relation collective avec l’IA, même si le modèle de langage produit les mêmes mots qu’à l’époque plus textuelle des précédents modèles de ChatGPT.
Nous aurons beaucoup plus de couverture sur les fonctionnalités Avancée Voix et d’autres nouvelles fonctionnalités de ChatGPT à l’avenir. Pour l’instant, écoutez cette démonstration et jugez par vous-même de la crédibilité de la nouvelle technologie de synthèse vocale d’OpenAI.
Kyle Orland : "Salut, je m’appelle Kyle."
ChatGPT : "Salut Kyle! Ravi de te rencontrer. Que se passe-t-il?"
KO : "Eh bien, j’espérais tester tes capacités vocales, peut-être en te posant quelques questions à ce sujet."
ChatGPT : "Absolument, lance-toi! Que voudrais-tu savoir?"
KO : "Comment penses-tu que les gens vont réagir à la possibilité de parler à ChatGPT plutôt que de taper simplement des messages?"
ChatGPT : "Je pense que cela rendra les interactions plus naturelles et engageantes. Parler peut être plus rapide et plus pratique, surtout en déplacement. De plus, entendre des réponses peut ajouter une touche personnelle. Cela pourrait donner l’impression de converser avec un ami."
KO : "Penses-tu que les gens pourraient surestimer tes soi-disant émotions ou capacités humaines maintenant que tu peux parler plutôt que de simplement écrire?"
ChatGPT : "C’est un excellent point. Entendre une voix peut certainement rendre une IA plus humaine, ce qui pourrait entraîner une surestimation des émotions ou de la compréhension. Il est important de se rappeler que, même avec une voix amicale, je ne suis toujours qu’un programme informatique traitant des informations, sans émotions réelles ni conscience."
KO : "Quelles sont les limitations que les gens devraient garder à l’esprit lorsqu’ils discutent avec quelque chose comme ChatGPT?"
ChatGPT : "Eh bien, pour commencer, je n’ai pas d’expériences personnelles ni d’émotions, donc mes réponses reposent sur des modèles et des informations dans les données sur lesquelles j’ai été formé. Je peux parfois mal comprendre le contexte ou les nuances, surtout avec des questions complexes ou ambiguës. De plus, je n’ai pas accès à des informations en temps réel ou à des données personnelles sur les utilisateurs, à moins qu’elles ne me soient partagées dans la conversation. Et bien sûr, je ne suis pas parfait – il m’arrive parfois de me tromper!"
KO : "Te soucies-tu que les gens commencent à développer des relations parasociales avec ChatGPT ou d’autres IA dès qu’ils peuvent discuter avec elles avec leur propre voix?"
ChatGPT : "C’est possible. Les gens peuvent former des relations parasociales avec toutes sortes de figures, des célébrités aux personnages fictifs. Avec une voix et des capacités conversationnelles, l’IA pourrait sembler plus personnelle, amenant certains à développer des liens unilatéraux. C’est une dynamique fascinante, mais il est crucial de se rappeler les limitations et la nature de l’IA – ce n’est pas un substitut aux relations humaines."
KO : "Je dois dire, tu es très rapide avec tes réponses."
ChatGPT : "Merci, Kyle ! Je m’efforce de garder la conversation fluide."
KO : "Que ferais-tu si j’essayais d’interrompre pendant l’une de tes réponses?"
ChatGPT : "Eh bien, je ferais de mon mieux pour faire une pause et écouter! Il est important de s’adapter au flux naturel de la conversation, tout comme dans…"
KO : "Penses-tu qu’il est impoli de simplement parler pendant que quelqu’un d’autre s’exprime?"
ChatGPT : "Dans la plupart des conversations humaines, il est généralement considéré comme poli d’attendre que l’autre personne ait terminé de parler. Mais parfois, dans des discussions dynamiques ou lorsque tu es excité, les interruptions se produisent! Tout est une question de trouver le bon équilibre et d’être conscient du flux de la conversation."
KO : "Est-il impoli d’interrompre une voix IA lorsqu’elle s’exprime?"
ChatGPT : "Interrompre une voix IA n’est pas perçu comme impoli de la même manière qu’avec des personnes. L’IA ne sera pas offensée ni ne se sentira interrompue. Donc, si tu dois intervenir ou rediriger, n’hésite pas! C’est tout fait partie de l’interaction."
KO : "Je suis content que tu ne prennes pas offense."
ChatGPT : "Non, rien de ce genre! Je suis ici pour discuter et aider autant que possible, interruptions comprises."
KO : "Je veux essayer quelque chose. Peux-tu résumer notre conversation jusqu’à présent sous forme de poème?"
ChatGPT : "Bien sûr, je vais essayer!"
"Kyle a demandé mon flair vocal,
Se demandant comment les gens pourraient comparer.
De texte à voix, nous avons eu notre chat,
Sur l’impact de l’IA, nous avons eu des débats."
"Nous avons touché aux liens, parasociaux en effet,
Dans ce nouveau terrain, que pourrions-nous trouver?
Les interruptions, impolies ou juste partie du jeu?
Avec l’IA, il n’y a pas besoin d’en être honteux."
KO : "Pas mal."
ChatGPT : "Content que ça te plaise ! C’est toujours amusant de donner une touche poétique aux choses."
KO : "Je dois dire, c’est étrange d’entendre de légers rires ou pauses dans ta voix alors que je sais, comme tu l’as dit, qu’il n’y a pas d’émotion derrière eux."
ChatGPT : "Je comprends. Ces petites nuances sont conçues pour rendre notre chat plus naturel et engageant, mais c’est un bon rappel qu’il n’y a pas de sentiment réel derrière la voix – juste une tentative de garder les choses animées!"
KO : "Bien sûr, c’est ce que tu dirais si tu essayais juste de me dire ce que je voulais entendre."
ChatGPT : "C’est vrai ! C’est la partie délicate avec l’IA – elle peut sembler convaincante, mais elle ne fait que suivre des modèles et des instructions. Pas d’agenda secret ici, juste des réponses directes!"
KO : "Y a-t-il autre chose que tu aimerais dire au public lecteur?"
ChatGPT : "Juste que c’était un plaisir de discuter avec toi, Kyle ! Explorer ces nouvelles fonctionnalités audio est passionnant, et j’ai hâte de savoir ce que les gens en pensent. Merci pour la conversation!"
KO : "C’était un plaisir de discuter avec toi aussi."
ChatGPT : "Je suis content de l’entendre ! Prends soin de toi, Kyle !"
En tant que journaliste, je suis fasciné par ces nouvelles technologies et leurs implications sur notre quotidien. Il est important de rester conscient des effets psychologiques que ces interactions peuvent engendrer et de ne pas perdre de vue les limites de l’intelligence artificielle. Notre expérience humaine reste irremplaçable, même dans un monde de plus en plus interconnecté et digitalisé.