Google vient d’annoncer deux nouvelles mises à jour dans son outil Text to Speech, Gemini 2.5 Flash et Gemini 2.5 Pro. Celles-ci promettent des dialogues fluides avec une précision et une expressivité améliorées. Ces deux nouveaux modes sont dès à présent disponibles via une mise à jour.
Text to Speech est une technologie de synthèse vocale qui permet de retranscrire un texte en discours oral naturel et optimisé grâce à Gemini. Google présente aujourd’hui deux nouveaux modes, Gemini 2.5 Flash et Gemini 2.5 Pro, qui introduisent une palette plus large d’expressivité vocale, une meilleure compréhension des consignes données, des ajustements de vitesse plus intelligents et une prise en charge couvrant désormais 24 langues.
Gemini 2.5 Flash et Gemini 2.5 Pro, deux nouveaux modèles pour plus de précision
Le premier mode Gemini 2.5 Flash est adapté aux scénarios à faible latence, tandis que Gemini 2.5 Pro donne la priorité à la qualité vocale.
Ces deux nouveaux modes promettent tous les deux, une expressivité améliorée grâce à une polyvalence de ton proposée. Le dialogue devrait alors être plus fluide grâce à des voix adaptées et cohérentes à chaque situation et ce même dans des scénarios multi-intervenants. Ces voix ont la capacité de réaliser des tons spécifiques allant de « joyeux et optimiste » à « sombre et sérieux ». Le rythme de précision a lui aussi été retravaillé et possède désormais un réglage de vitesse plus intelligent et un meilleur suivi des instructions.
Ce n’est pas tout, les capacités multilingues ont elles aussi été améliorées, 24 langues sont désormais prises en charge par l’outil Text to Speech.
Ces améliorations devraient permettre de répondre davantage aux besoins des utilisateurs, mais aussi de faire face à des critiques de longue date sur l’outil Text to Speech à qui l’on reprochait jusqu’à présent d’être trop impersonnel.
Ces deux nouveaux modes sont disponibles dès à présent via l’API Gemini dans Google AI Studio et remplacent les anciennes versions de TTS sorties en mai 2023.
👉🏻 Suivez l’actualité tech en temps réel : ajoutez 01net à vos sources sur Google, abonnez-vous à notre canal WhatsApp ou suivez-nous en vidéo sur TikTok.
Par : Opera
Source :
Google