Google vient de lever le voile sur PaLM 2, sa contre-attaque à GPT-4. Ce nouveau modèle d’IA, destiné à animer tous les produits de la marque, se distingue par de meilleures capacités et quatre déclinaisons…
Durant la conférence d’ouverture de la Google I/O, Google a présenté une nouvelle version de son modèle linguistique, PaLM (Pathways Language Model). Pour mémoire, la première itération du modèle a été dévoilée un an plus tôt, lors de la Google I/O 2022, des mois avant la tornade ChatGPT.
Conçu comme une alternative à GPT-4, la dernière version du modèle derrière ChatGPT, PaLM 2 se distingue d’abord par la prise en charge de 100 langues différentes. En entraînant le modèle avec des contenus rédigés dans une grande variété de langues, Google affirme avoir « amélioré sa capacité à comprendre, générer et traduire des textes nuancés ». Le modèle bénéficie d’une fine compréhension de la langue, y compris des expressions, des énigmes et des poèmes, dont les métaphores peuvent complexifier la tâche de l’IA générative.
À lire aussi : Google I/O 2023 – Search, Bard, Gmail, Maps… Toutes les annonces de la keynote
Les atouts de PaLM 2
De plus, PaLM 2 profite d’une meilleure logique, d’un bon sens amélioré et de compétences en mathématiques renforcées. Pour parvenir à ces optimisations de taille, Google explique avoir entraîné le modèle avec « des articles scientifiques et des pages Web qui contiennent des expressions mathématiques ». En théorie, PaLM 2 va pouvoir venir rivaliser avec GPT-4, dont la faculté de raisonnement nous avait impressionnés.
De même, le modèle se veut meilleur en programmation grâce à un entraînement basé sur « une grande quantité d’ensembles de données de code source accessibles au public ». D’après Google, PaLM 2 excelle dans la génération de code en Python et JavaScript. Il peut aussi produire du code dans des langages de programmation moins répandus, comme Prolog, Fortran et Verilog. L’entreprise n’hésite pas à mettre en avant l’IA comme un assistant de codage.
Ce nouveau modèle de langage permet au géant de la recherche d’apporter de sérieuses améliorations à Bard, son chatbot intelligent. Animé par PaLM 2, le robot conversationnel bénéficie donc de meilleures compétences de raisonnement, de calcul et de codage. Dans un avenir proche, le modèle permettra surtout à Bard de comprendre et d’écrire dans plus de 40 langues différentes.
Quatre versions de PaLM 2
En miroir de ses rivaux, comme Meta ou OpenAI, Google décline son nouveau modèle en plusieurs variantes. Le géant de Mountain View a mis au point quatre versions de PaLM 2 : Gecko, Loutre, Bison et Licorne.
Si Licorne représente la version la plus puissante, et la plus lourde, du modèle, Gecko est présenté comme une déclinaison plus légère, compatible avec des appareils moins puissants qu’un ordinateur :
« Il peut fonctionner sur des appareils mobiles et est assez rapide pour d’excellentes applications interactives sur l’appareil, même hors ligne ».
Cette variété de tailles vise à faciliter le déploiement du modèle pour « un large éventail de cas d’utilisation ». Avec des itérations moins gourmandes en ressources, Google semble aussi répondre au boom de l’intelligence artificielle open source. En s’appuyant sur la fuite de LLaMA, pour Large Language Model Meta AI, le modèle de langage de Meta, la communauté open source a rapidement développé des solutions IA qui tournent sans problème sur des appareils peu véloces, comme un téléphone mobile. Un ingénieur de Google s’est d’ailleurs inquiété des innovations nées de l’open source, estimant que celles-ci représentent une menace pour le géant de la recherche, bien plus qu’OpenAI ou Microsoft. On ne s’étonnera donc pas que Google ait développé une version de PaLM 2 qui puisse tourner sur smartphone.
Fort de ce quatuor de modèles, Google ambitionne d’ajouter l’IA générative à son écosystème de produits. Outre Bard, PaLM 2 va venir enrichir des outils comme Gmail, Google Docs ou Google Sheets. Plus de 25 nouveaux produits et fonctionnalités reposent déjà sur le modèle linguistique, se félicite Google. Il est notamment derrière Med-PaLM 2, un modèle dédié au milieu médical. Entraînée sur des données médicales grâce à l’apprentissage automatique, cette itération est capable de répondre à des questions de médecine, de santé ou encore de chirurgie. Il peut également interpréter la radio d’un patient pour en tirer un diagnostic, aussi bien qu’un professionnel de la santé, estime Google.
Durant la conférence, Google a aussi teasé l’intégration de l’IA générative, animée par PaLM 2, au sein de son moteur de recherche. Pour contrer Microsoft Bing, qui a adopté ChatGPT quelques mois plus tôt, Google va ajouter un mode « conversation » à son moteur. Par le biais d’une boîte de dialogue dédiée, l’IA va répondre à la requête de l’internaute. Plutôt que de parcourir les résultats, l’utilisateur obtiendra un résumé taillé sur mesure pour répondre à sa question. On trouve une logique analogue chez Brave. Dopé par l’IA, le moteur combine les données de plusieurs sites pour générer un résumé cohérent.
Un aperçu du futur de l’IA chez Google
Enfin, Google a évoqué l’avenir. La firme révèle d’ores et déjà travailler sur le prochain modèle linguistique qui animera ses produits et services, comme Bard. Baptisé Gemini, ce futur modèle de langage est décrit comme multimodal – il peut traiter plusieurs sources de données, comme du texte, de l’audio ou des images – et « très efficace ». Il sera par ailleurs décliné en différentes tailles.
Google précise que Gemini est toujours en cours de formation. Au sein de ses laboratoires, le groupe entraîne actuellement le modèle avec une montagne de données. Faut-il s’attendre à une présentation dès 2024 lors de la prochaine Google I/O ?
Source :
Google