OpenAI a dévoilé une nouvelle version du Mode Vocal de ChatGPT, visant à rendre l’expérience de conversation plus fluide et naturelle. Cette mise à jour permet à l’assistant vocal de mieux gérer les interactions en évitant d’interrompre l’utilisateur trop rapidement. Désormais, il prend en compte les pauses dans la conversation sans supposer automatiquement la fin d’une réflexion, comblant ainsi l’un des défauts courants des assistants vocaux.
Malgré la présence de cette fonctionnalité depuis son lancement, le Mode Vocal Avancé de ChatGPT souffrait encore de coupures prématurées, rendant les échanges prolongés moins naturels qu’avec un interlocuteur humain. Cette version améliore la gestion des silences : comme le montre la vidéo de démonstration, l’assistant reste attentif même après une longue pause et ne reprend la parole que lorsque l’utilisateur a terminé son intervention.
L’assistant vocal a également été mis à jour pour gagner en personnalité, ce qu’OpenAI décrit comme « plus engageant, direct et concis ». Résultat : il est censé paraître plus « naturel » et moins robotique. Cette différence semble très subtile, et relève finalement d’une question de préférence.
Test du mode vocal avancé sur l’iPhone 16 Pro
Associé au bouton d’action de l’iPhone 16 Pro, l’utilisation du mode vocal de ChatGPT se fait naturellement.
Dès la première interaction, une différence se fait sentir : l’assistant marque un temps d’attente plus long avant de répondre, adoptant un rythme moins précipité et plus naturel.
Lorsqu’on interroge l’IA sur les nouveautés introduites par cette mise à jour, elle explique que les interactions sont désormais plus naturelles. « Je peux répondre d’une manière qui ressemble davantage à une vraie conversation. Je peux adapter mon ton, poser des questions complémentaires et, de manière générale, fluidifier les échanges ! »
Une évolution qui promet d’améliorer encore l’expérience utilisateur pour ceux qui s’appuient sur l’IA au quotidien.
La capacité de l’IA à adapter son ton se révèle particulièrement impressionnante, comblant un manque souvent observé dans les assistants vocaux : l’incapacité à reproduire les nuances d’une conversation humaine. Pour mettre cette fonctionnalité à l’épreuve, nous avons exprimé des émotions contrastées, à la fois déprimés et optimistes. Dans chaque cas, l’assistant ajuste sa voix : adoptant un ton plus doux et compréhensif, puis devenant plus enjoué et dynamique.