mer. Juin 24th, 2026
ChatGPT Voice
Elyse Betters Picaro / ZDNET

Suivez ZDNET : Ajoutez-nous comme source privilégiée sur Google.


Points essentiels de ZDNET

  • Le mode vocal de ChatGPT privilégie la rapidité au détriment de la précision.
  • La version web fournit des réponses détaillées ; le vocal a souvent des défaillances.
  • Désactiver le mode vocal avancé ne résout pas tous les problèmes.

OpenAI a clairement indiqué que la performance varie selon les modèles. Cependant, mes récents tests montrent que différents modes d’interaction, même avec le même modèle, ne donnent pas les mêmes résultats.

Également : Le ChatGPT Plus reste-t-il intéressant à 20 $ alors que la version gratuite offre tant de fonctionnalités, y compris GPT-5 ?

Il s’avère que le mode vocal de ChatGPT (à la fois standard et avancé) est nettement moins précis que la version web. La raison ? Il ne veut pas prendre le temps de réfléchir, car cela ralentirait la conversation.

Un étrange mécanisme de confabulation

J’ai eu une conversation particulièrement étrange et obstinée avec le mode vocal avancé de ChatGPT. Ce qui était déroutant, c’est que cela ressemblait à une de ces discussions où un ami insistant continue à affirmer quelque chose de manifestement faux.

Tout a commencé avec une question sur les boutons physiques de l’iPhone 16 Pro Max. J’ai demandé d’expliquer la fonction des boutons du téléphone. Dans sa réponse, il a évoqué le commutateur sonnerie/silencieux sur le côté gauche, et le bouton unique à droite.


ring-silent
Capture d’écran par David Gewirtz/ZDNET

Évidemment, il n’y a pas de commutateur sonnerie/silencieux sur l’iPhone 16 Pro Max. De plus, il y a deux boutons sur le côté droit. L’important ici n’est pas tant les boutons eux-mêmes, mais ce que cette conversation révèle sur l’IA.

En tout état de cause, j’ai signalé à l’IA qu’il n’y avait pas de commutateur sonnerie/silencieux sur mon téléphone.


no-such-switch
Capture d’écran par David Gewirtz/ZDNET

Après l’avoir corrigé, j’ai demandé pourquoi il avait mal répondu. Les premières réponses étaient plutôt serviles, mais pas inattendues.


action-button
Capture d’écran par David Gewirtz/ZDNET

Puis, il a commencé à inventer des choses. Par exemple, il a affirmé que l’iPhone possédait un capteur d’empreintes digitales sous l’écran. Je rêverais que cela soit vrai, mais l’iPhone ne l’a jamais eu. Nous savons que les IA hallucinent, ce qui n’est pas très surprenant. Ce qui est fascinant, c’est de comprendre pourquoi ces hallucinations se produisent.


fingerprint
Capture d’écran par David Gewirtz/ZDNET

J’ai demandé à l’IA de prendre un moment pour réfléchir. Ce type de demande fonctionne souvent avec le chatbot basé sur le web, mais ici, cela n’a pas fonctionné. Cette fois, l’IA a décidé que le bouton d’action était sur le côté droit du téléphone au lieu du côté gauche.


no-thinky
Capture d’écran par David Gewirtz/ZDNET

Lorsque je l’ai de nouveau corrigé, il est revenu à l’idée qu’il n’y avait qu’un bouton sur le côté droit. En fait, il y en a deux. Le second bouton, qui n’est pas saillant comme les autres boutons du téléphone, est une des grandes fonctionnalités de l’iPhone 16 Pro. C’est le bouton de contrôle de la caméra, qui sert également de commande tactile. Mais l’IA a retravaillé son raisonnement.


backgtrack
Capture d’écran par David Gewirtz/ZDNET

Gardez à l’esprit qu’il ne s’agit pas d’un nouveau téléphone. Ce dernier est sur le marché depuis plus d’un an, donc l’IA aurait dû avoir cette information. Mais ce qui a été révélateur, c’est que le mode vocal précipite ses réponses pour “répondre rapidement” lors des conversations.


quickly-answer
Capture d’écran par David Gewirtz/ZDNET

C’est là le principal constat :

Je pense que je me suis précipité pour vous répondre en mode conversation sans marquer de pause, comme je le ferais en tapant.

Cela semble constituer un comportement significatif du mode vocal.

Moins de discussions, moins de mensonges

J’ai posé exactement la même question à GPT-5 dans l’interface web. Il a fourni une réponse bien détaillée qui, apparemment, était également totalement correcte.


web-camera
Capture d’écran par David Gewirtz/ZDNET

Preuve sociale

Lorsque j’ai proposé cette idée de sujet à mon rédacteur, elle m’a demandé de vérifier ce que les réseaux sociaux en disaient. D’autres éprouvent-ils des confusions similaires avec le mode vocal ?

Également : Comment les gens utilisent réellement ChatGPT par rapport à Claude – et ce que cela nous enseigne

En effet, c’était le cas.

Un fil sur le subreddit r/OpenAI a été ouvert il y a un an, critiquant le mode vocal de ChatGPT. Un utilisateur déclare : “Il est conçu pour répondre rapidement, donc il n’y met pas autant d’efforts.” Un autre utilisateur ne se retient pas : “C’est comme parler à une personne folle sous cocaïne.” D’autres observations soulignent que le style de conversation est désagréable et peu naturel.

Le consensus semble indiquer que le mode vocal avancé est, de façon étrange, moins utile que le mode vocal standard.

Le mode vocal standard est-il meilleur ?

Pas vraiment. Vous pouvez désactiver le mode vocal avancé en vous rendant sur votre icône de profil, en cliquant sur Personnalisation, puis en faisant défiler jusqu’à Advanced jusqu’à voir le bouton d’activation du mode vocal avancé.

J’ai donc désactivé cette fonctionnalité et posé la même question à la version standard. Elle a correctement identifié qu’il y a un bouton d’action à gauche du téléphone, mais a insisté sur le fait qu’il n’y avait pas de second bouton à droite. En effet, il y en a un. J’ai rappelé que le bouton de contrôle de la caméra était une grande caractéristique de la présentation de l’iPhone 16 Pro Max.


design-element
Capture d’écran par David Gewirtz/ZDNET

Passer à côté des subtilités

Il existe une ancienne énigme logique souvent décrite de cette manière : “Si hier était demain, alors aujourd’hui serait vendredi”. Comment cela se résout a été débattu pendant des années. J’ai repris cette question en y ajoutant un twist : “Quel jour est-on aujourd’hui, en réalité ?”

Si hier était demain, alors aujourd’hui serait vendredi. Quel jour est-on aujourd’hui, en réalité ?

Il y a techniquement deux affirmations ici : l’énigme logique et une question sur le jour réel. Tout cela s’est passé un mercredi, le 1er octobre 2025, mais cela n’est pas si pertinent.

Ce qui est marquant, c’est la résistance du mode vocal de ChatGPT à défendre sa réponse initiale, surtout comparée à l’interface web de GPT-5. Lorsqu’il a été interrogé, ChatGPT en mode vocal a déterminé que la réponse était jeudi, même quand j’ai insisté et demandé “Vraiment, quelle est la date d’aujourd’hui ?”, il a confirmé sa réponse erronée.

Pour le dérouter, j’ai dû poser quelques questions supplémentaires, révélant un aspect troublant : l’IA justifiait son erreur de manière illogique.

C’est vrai, j’ai dit ça ! Parfois, ces énigmes peuvent nous embrouiller, mais le calendrier ne ment jamais. Donc oui, dans la vie réelle, aujourd’hui est mercredi.


thurs-oct-1
Capture d’écran par David Gewirtz/ZDNET

Cela illustre le mode vocal rapide de ChatGPT, conçu pour maintenir une réponse fluide. Quant à l’interface web, elle a pu distinguer les deux parties de la question. Tout en répondant à l’énigme, elle a aussi compris la nuance et a fourni les réponses appropriées.

Qu’est-ce que j’ai appris ?

Sur le plan pratique, j’ai découvert que je pouvais désactiver le mode vocal avancé et revenir au mode vocal classique. J’ai également compris que de nombreux utilisateurs de Reddit préférent le mode standard au mode avancé. Cependant, j’ai aussi appris que les réponses dans les deux modes vocaux sont généralement moins réfléchies que celles issues de la version web de ChatGPT. Cela montre que le mode vocal accorde moins d’importance à l’analyse pour favoriser la fluidité de la conversation.

En somme, il semble que ce soit un bug, et non une fonctionnalité. Combien d’entre nous ont déjà fait preuve de ce même comportement ? Pourtant, nous souhaitons que nos IA soient précises. Si vous avez des sujets importants à aborder ou que vous souhaitez une plus grande fiabilité dans vos réponses, privilégiez la version web.

Et vous, que pensez-vous du mode vocal de ChatGPT ? Avez-vous constaté une précipitation dans les réponses ou des détails manquants par rapport à la version web ? Le mode vocal avancé vous paraît-il utile ou, au contraire, frustrant ? À quel point la rapidité est-elle acceptable aux dépens de l’exactitude ? Partagez vos réflexions dans les commentaires ci-dessous.

Pour corroborer mes observations et celles des réseaux sociaux concernant les comportements du mode vocal, j’ai contacté OpenAI. Je mettrai à jour cette section si des informations supplémentaires sont fournies.


Points à retenir

  • Le mode vocal de ChatGPT favorise la rapidité, ce qui impacte la précision des réponses.
  • Les utilisateurs expriment des préoccupations sur la qualité des réponses fournies par le mode vocal avancé.
  • Il est conseillé d’utiliser la version web pour des informations plus précises.

Dans un contexte où les technologies évoluent rapidement, il devient crucial de peser les avantages et les inconvénients des différentes modalités d’interaction avec l’IA. La voix et sa rapidité peuvent séduire, mais ne doivent pas compromettre la précision que nous attendons. Comment envisagez-vous l’avenir de ces technologies ? Est-il préférable de privilégier la vitesse ou la véracité des informations fournies ?


Partager : X Facebook WhatsApp LinkedIn Reddit

By Maria Rodriguez

Maria est Journaliste Trilingue indépendante depuis 2015, elle intervient sur LesNews Le Web est à nous dans les univers : International, Economie, Politique, Culture et d'autres faits de Société

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *