En pleine affaire Sam Altman, OpenAI a tout de même trouvé le temps d’annoncer que ChatGPT Voice est déployé pour tous les utilisateurs gratuits du célèbre agent conversationnel sur mobile, avec l’application pour Android et iOS.
L’annonce a été relayée par Greg Brockman, un cofondateur également de retour chez OpenAI après sa démission, qui évoque un changement total de l’expérience avec ChatGPT.
La possibilité de conversations vocales bidirectionnelles avec ChatGPT avait été officialisée en septembre dernier, mais dans le cadre des abonnements payants ChatGPT Plus et ChatGPT Enterprise. Elle devient donc désormais disponible pour le commun des utilisateurs de ChatGPT ayant droit à la technologie GPT-3.5.
Cinq voix à disposition pour ChatGPT
Pour parvenir à ChatGPT Voice, OpenAI avait mis en avant un nouveau modèle de synthèse vocale capable générer un son de type humain depuis un texte et un échantillon de parole de quelques secondes.
Des voix ont été créées en collaboration avec des acteurs professionnels. En pratique, ChatGPT propose le choix parmi cinq voix (Breeze, Cove, Juniper, Sky et Ember), en sachant que le français est par exemple de la partie.
Pour la transcription des paroles des utilisateurs en texte, le système open source de reconnaissance vocale Whisper d’OpenAI est exploité.
Tailler une bavette avec ChatGPT
À l’issue d’une discussion vocale avec ChatGPT initiée par un appui sur une icône en forme de casque audio, les échanges, aussi nombreux que souhaité, sont retranscrits et accessibles dans l’historique. Ces échanges se font de manière naturelle et peuvent être enchaînés sans un quelconque mot clé à prononcer.
» Vous pouvez utiliser la voix pour engager une conversation avec votre assistant. Parlez-lui en déplacement, demandez-lui une histoire pour votre famille ou réglez un débat à table. «
Si OpenAI évoque un assistant, ChatGPT Voice ne permet toutefois pas d’interagir directement avec des fonctionnalités du smartphone.