Ciblant une prise en charge des mille (!) langues les plus parlées, Google veut que son IA puisse parler – et répondre – à la plupart des habitants de notre planète. Si la technologie fonctionne, elle rendra ses services quasi universels. Et gommera, peut-être, la domination de l’anglais.
Après avoir construit la tour de Babel, les hommes auraient essuyé la colère de Dieu, qui nous aurait divisé en introduisant les langues. Google semble vouloir réparer cette injustice mythologique avec une nouvelle intelligence artificielle qui parlerait « les mille langues les plus parlées sur Terre ». Rien que ça – et prend ça dans les dents, Dieu.
Google est déjà un champion mondial de la traduction avec son service Google Translate, brique technologique qu’il intègre un peu partout, mais le travail est loin d’être parfait. De nombreuses langues sont peu ou pas du tout prises en charge, les traductions sont souvent imparfaites. Et pur bien des services, l’anglais domine. Il a ainsi fallu plusieurs années à Google pour intégrer d’autres langues dans le transcripteur de texte « Enregistreur » exclusif de ses Pixel.
Babel a peut-être été détruite en un jour, mais il a fallu plus de temps pour bâtir Rome. En tant qu’entreprise humaine, Google a donc commencé par poser un premier objectif de prise en compte de 400 langues par sa nouvelle IA. Quand on sait qu’il y a 22 langues officielles en Inde, on comprend aisément pourquoi ces 400 langues ne sont qu’une étape. L’Afrique à elle seule compterait aux alentours de 2000 langues et dialectes (mais les chiffres vont jusqu’à 3000 !), ce qui devrait occuper les ingénieurs pendant un temps. Google n’est d’ailleurs pas la seule entreprise sur le coup, mais le projet le plus avancé, celui de Meta, se contente de “seulement” 200 langues.
Lire aussi : Meta a développé une IA de traduction capable de traduire les langues les plus exotiques (juillet 2022)
L’IA de Google ne va pas combiner plusieurs briques combinant les langues, mais va bel consister en un seul modèle qui sera entraîné à les connaître toutes. « En ayant un seul modèle exposé et entrainé à plusieurs langues, on profite de meilleures performances, notamment sur les langues avec peu de ressources », a déclaré à The Verge le vice-président de la recherche chez Google AI, Zoubin Ghahramani. Qui a expliqué que l’AI de qu’ils développent va s’appuyer sur les similarités entre certaines langues pour renforcer sa robustesse.
Car l’IA de Google n’est pas uniquement pensée pour permettre à un marchand tamoul de vendre du thé à un négociant ouzbèke. Google envisage son outil comme un super langage capable aussi bien « de transformer des commandes (envoyées à un robot, ndr) en code ou de résoudre des problèmes mathématiques ». Tout cela en plus de la traduction. Faisant de l’IA un modèle numérique capable de résoudre de très nombreux problèmes. Pour différents services : même si Google n’a pas communiqué de produits ciblés pour son IA, toutes les briques du géant américain pourraient en profiter.
Pour l’heure à l’état de recherche appliquée, le projet de Google n’a pas encore de feuille de route publique définie. Mais outre la tâche dantesque de créer une IA super multilingue, tâche nouvelle s’il en est, d’autres défis connus attendent. Comme éviter de créer un monstre, comme c’est souvent le cas lors de l’entraînement de ce genre de modèle. Car, produit des hommes, les IA sont parfois à notre image, c’est-à-dire avec un mauvais fond. Un zeste d’intervention divine serait sans doute le bienvenu !
Source :
The Verge