Lors de sa conférence annuelle Google I/O, la firme de Mountain View a annoncé de nouvelles fonctionnalités pour son chatbot IA, Gemini, lui permettant ainsi de mieux concurrencer son rival ChatGPT. Trois mois plus tard, elles sont enfin disponibles pour Gemini et les utilisateurs peuvent commencer à les utiliser dès aujourd’hui.
Ainsi, le nouveau modèle de génération d’images, Imagen 3, est désormais disponible sur Gemini, Gemini Advanced (version payante), Business et Entreprise. Les Gems, une nouvelle fonctionnalité qui permet de créer des assistants personnalisés dans Gemini, est également déployé pour les utilisateurs de Gemini Advanced, Business et Enterprise.
Imagen 3
Imagen 3 est le générateur d’images le plus récent et le plus avancé de Google. Grâce à cette mise à niveau, les utilisateurs bénéficieront d’une qualité d’image lors de la génération d’images à partir du chatbot Gemini.
Récemment, Google DeepMind a publié un article évaluant les performances d’Imagen 3 par rapport à son prédécesseur, Imagen 2, et à d’autres modèles concurrents, notamment DALL-E 3, Midjourney v6, Stable Diffusion 3 Large et Stable Diffusion XL 1.0.
Dans la catégorie de préférence globale d’évaluation humaine, qui mesurait le degré de satisfaction d’un utilisateur vis-à-vis de l’image par rapport à la requête donnée, Imagen 3 a gagné avec une avance significative. Nous avons également été continuellement impressionnés par les images de haute qualité produites par ImageFX, le générateur d’images autonome de Google alimenté par Imagen 3.
La génération gratuite d’images de haute qualité est un avantage considérable de l’utilisation du chatbot Gemini. Avec ChatGPT, la génération d’images à l’aide de DALL-E 3 nécessite un abonnement mensuel de 20 $ à ChatGPT Plus.
Google a également indiqué que l’intégration d’Imagen 3 dans Gemini comportait des protections intégrées et Synth-ID, qui insère un filigrane dans les images pour indiquer qu’elles ont été générées à l’aide de l’IA.
Dans les prochains jours, Google va également déployer la capacité de générer des images de personnes. Cependant, les versions en accès anticipé seront d’abord disponibles pour les utilisateurs de Gemini Advanced, Business et Enterprise en anglais. Cette fonctionnalité présente certaines limitations, notamment la génération d’individus et de mineurs identifiables et de scènes violentes, sanglantes ou sexuelles.
Gems
Lors de Google I/O, Google a annoncé les Gems, qui sont des versions personnalisées de Gemini pour accomplir à des tâches particulières. Pour configurer un Gem, un utilisateur doit simplement lui donner une instruction, le nommer et l’utiliser lorsque cela est nécessaire pour exécuter une fonction spécifique.
Cette fonctionnalité est presque identique aux GPT personnalisés de ChatGPT, qui peuvent également être chargés d’exécuter une fonction, être nommés et partagés avec d’autres utilisateurs. Ces options permettent de gagner du temps à long terme, en particulier pour les tâches répétitives.
Google cite quelques cas d’utilisation possibles de Gem, notamment la personnalisation pour en faire un partenaire de codage, un éditeur de rédaction, un guide de carrière et un coach d’apprentissage. Cette fonctionnalité est déployée sur ordinateur et mobile pour les utilisateurs de Gemini Advanced, Gemini Business et Gemini Enterprise dans plus de 30 langues et 150 pays.
La création d’assistants personnalisés est une fonctionnalité payante sur ChatGPT et Gemini. Cependant, si vous cherchez un moyen de le faire gratuitement, You.com permet aux utilisateurs de créer des assistants personnalisés en utilisant la plupart des grands modèles linguistiques (LLM) les plus populaires du marché.