Encore expérimental, l’agent conversationnel Bard de Google est maintenant animé par le modèle d’IA Gemini Pro en France. Il prend ainsi la suite du modèle de langage PaLM 2.
Gemini Pro est la version intermédiaire du grand modèle de langage Gemini conçu pour être multimodal. Elle se positionne entre Gemini Nano pour un fonctionnement en local (Pixel 8 Pro et Galaxy S24 de Samsung) et Gemini Ultra aux capacités accrues.
» Cette mise à niveau permettra d’étendre les capacités de Bard à comprendre, résumer, raisonner, réfléchir, écrire et planifier « , indique Google. » Avec Gemini Pro, vous pouvez découvrir de nouvelles façons de créer, d’interagir et de collaborer avec Bard. «
Avec contrôle de la recherche Google
Gemini Pro à la manœuvre pour Bard est une nouveauté en France, mais pas aux États-Unis où c’était déjà le cas depuis fin 2023. Plus globalement, c’est un déploiement à grande échelle pour une disponibilité dans une quarantaine de langues et plus de 230 pays.
Indépendamment de Gemini Pro, la fonctionnalité de double vérification pour Bard fait par ailleurs son apparition dans les autres langues que l’anglais. Il s’agit d’un bouton avec l’icône » G » de Google pour vérifier s’il existe du contenu web venant étayer une réponse.
Le cas échéant, cet auto-contrôle de Bard met en avant des phrases pour des informations complémentaires, voire contradictoires avec la recherche Google.
Réponse à DALL-E 3 et autres
Uniquement en anglais dans Bard cette fois-ci, la génération gratuite d’images via un prompt se fait sous la houlette du modèle Imagen 2. Cette technologie de Google DeepMind peut générer des images photoréalistes sur la base d’une description. Hors Bard, c’est un outil ImageFX.
La génération des images est associée à un outil SynthID pour intégrer des filigranes identifiables numériquement dans les pixels. Google souligne en outre que des filtres ont été conçus pour éviter la génération d’images de personnes nommées.