Meta développe un modèle d’IA capable de traduire « de la parole vers la parole » près de 35 langues

Meta veut révolutionner notre relation à la tech d'ici à 2027.


Seamless M4T, le nouvel outil de traduction de Meta, permettrait de traduire de texte à texte une centaine de langues, et de la parole à la parole près de 35 langues.

Si vous êtes en vacances à l’étranger dans un pays dont vous ne maîtrisez absolument pas la langue, cette information devrait vous intéresser. Meta, la maison mère d’Instagram, de Facebook et de WhatsApp, a lancé mardi 22 août un traducteur alimenté par l’intelligence artificielle (IA) qui permet de traduire une centaine de langues à l’oral ou à l’écrit, sans avoir à convertir les mots en texte. Meta promet, selon son billet de blog, une traduction de la parole à la parole, de la parole au texte et du texte à la parole. Le système pourrait même changer de langue en pleine traduction, ce qui permet de traduire les individus qui utilisent plusieurs langues au quotidien.

De quoi « permettre aux personnes parlant des langues différentes de communiquer plus efficacement », écrit Meta dans son article de blog. Selon la firme de Menlo Park, il s’agit du tout « premier modèle de traduction par IA multimodal et multilingue tout-en-un », capable de reconnaître la parole et de traduire de la parole au texte dans près de 100 langues différentes. Le modèle peut également interpréter la parole et le texte et traduire à l’oral près de 35 langues. Dans une vidéo publiée sur le blog de Meta, on peut voir Paco Guzmán, le directeur scientifique de Meta Research, prononcer la phrase en espagnol : « notre objectif est de créer un monde plus connecté ». Cette phrase a ensuite été traduite en vietnamien par une voix informatisée. Ce dernier a expliqué que contrairement à d’autres systèmes qui reposent sur différents modèles, chargés à différents niveaux de gérer la reconnaissance vocale, la traduction de texte, et le fait de générer du texte à partir de la parole, « SeamlessM4T le fait en une seule fois ». « Il ne s’appuie pas sur des modèles intermédiaires pour produire des résultats », explique-t-il.

Une suite logique d’Universal Speech Translator, de Massively Multilingual Speech et de NLLB-200

Sur cette page, vous pouvez tester directement ce nouveau modèle. Le système, appelé Seamless M4T, est publié sous licence Creative Commons. L’entreprise donne également accès aux métadonnées de SeamlessAlign, qui contient plus de 270 000 heures de sons et de textes. Ce système semble rassembler toutes les dernières avancées de Meta en la matière, écrivent les équipes du groupe de Mark Zuckerberg dans l’article de blog, ces derniers n’hésitant pas à qualifier cette étape « d’avancée significative ». Il serait la suite logique de trois éléments : Universal Speech Translator, le système de traduction directe de la parole à la parole de Meta qui prend en charge le hokkien (un dialecte oral chinois). Vient ensuite Massively Multilingual Speech, l’outil de Meta qui permet de détecter et d’identifier plus de 1 100 langues. Et enfin NLLB-200 (pour No Language Left Behind, littéralement, Aucune Langue Laissée Derrière) : ce dernier modèle de traduction automatique alimenté par l’Intelligence artificielle s’attaque aux langues moins courantes. Il a été lancé en juillet dernier.

Pour Seamless M4T, les chercheurs de Meta auraient travaillé sur près de 4 millions d’heures de sons pour entraîner ce modèle : ces données proviendraient « d’un référentiel public de données web explorées ». Interrogé par nos confrères de TechCrunch, Meta a refusé de donner plus d’informations sur ce point. Le nouveau système parviendra-t-il à éviter les biais et préjugés sexistes que l’on reproche régulièrement à la traduction assistée par l’IA ? Les traducteurs supposent par exemple souvent que les médecins sont des hommes et les infirmières des femmes. C’est toute la question. Meta déconseille néanmoins l’utilisation de SeamlessM4T pour les traductions longues ou certifiées. Même chose en cas de finalité médicale ou juridique : une préconisation qui pourrait prémunir le groupe de poursuites judiciaires en cas d’erreurs ou d’approximations.

Source :

Article de blog de Meta du 22 août 2023



Source link

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.