Le navigateur Chrome de Google pour MacOS et Windows reçoit une infusion de nouvelles capacités alimentées par Gemini, y compris un assistant de navigation IA sensible aux activités de navigation de l’utilisateur. Google a fait cette annonce aujourd’hui lors de la conférence Google I/O 2025.
Baptisée Gemini-in-Chrome, cette fonctionnalité est disponible pour les abonnés Google AI Pro et Google AI Ultra aux États-Unis, ainsi que pour les utilisateurs de Chrome Beta, Dev et Canary.
L’idée générale de Gemini-in-Chrome est de réorganiser, d’agréger et de réafficher de manière plus judicieuse les données trouvées dans un ou plusieurs onglets du navigateur. Le tout en agrémentant le résultat final d’informations supplémentaires – mais pertinentes – générées par Gemini-.
Un exemple pour le e-commerce
Lors d’une démo, Charmaine D’Silva, directrice de la gestion des produits Chrome chez Google, a montré comment Gemini-in-Chrome pouvait non seulement organiser un tableau comparatif des caractéristiques de sacs de couchage – vers lequel pointaient plusieurs onglets Chrome (un onglet par sac de couchage) – mais aussi répondre à des prompts concernant l’adéquation de chaque sac aux températures prévues pour un prochain séjour en camping.
Un exemple pour la recherche documentaire sur le Web
Outre l’exemple des achats, Mme D’Silva a pointé l’un de ses onglets Chrome vers une page web évoquant le livre Le merveilleux magicien d’Oz, puis, en utilisant la fonction de synthèse vocale Live de Gemini, elle a demandé : « Pouvez-vous me dire quels sont les principaux thèmes de ce livre ? »
Gemini a répondu en notant plusieurs thèmes explorés par le livre, notamment le voyage à la découverte de soi et l’idée que ce que nous cherchons peut déjà se trouver à l’intérieur de nous.
D’Silva a ensuite posé d’autres questions à Gemini Live sur les différences entre le livre et le film Wicked, et sur la signification de la couleur des chaussures de Dorothy.
Un LLM qui travaille dans le contexte de l’activité du navigateur
Alors que des LLM concurrents répondraient probablement aux mêmes questions, c’est la présence d’un LLM opérant dans le contexte de l’activité du navigateur de l’utilisateur qui ouvre la voie à un nouveau mélange de recherche et d’IA.
Par ailleurs, Gemini Livepeut faire défiler la page en cours jusqu’à l’endroit où une certaine image est affichée. Et ce sur la base du souvenir verbal de l’utilisateur du contenu de l’image, et la capacité à produire des dérivations du contenu de la page web en cours. Par exemple, l’IA a dérivé une version sans gluten de la recette de dessert qu’un utilisateur était en train de consulter.
Selon M. D’Silva, au cours de l’année 2025, Gemini-in-Chrome évoluera pour devenir un point d’entrée permettant de contrôler verbalement une grande partie de l’expérience du navigateur Chrome. Dans une perspective plus large, Google considère Gemini-in-Chrome comme la clé d’une amélioration considérable de la productivité.
« Nous cherchons à transformer ces tâches de 30 minutes en voyages de trois clics »
« S’il y a des choses fastidieuses pour vous, elles sont dans notre ligne de mire », a déclaré Parisa Tabriz, vice-présidente et directrice générale de Google Chrome. « À un niveau élevé, nous cherchons à transformer ces tâches de 30 minutes en voyages de trois clics ».
Ce n’est pas la première fois que Google améliore Chrome avec des capacités d’IA. Le navigateur s’appuie déjà sur l’IA pour rendre le contenu web plus accessible aux personnes souffrant de déficiences visuelles et auditives. Par exemple, Chrome s’appuie sur l’IA pour créer automatiquement des descriptions d’images et de graphiques, qui peuvent ensuite être analysées par les lecteurs d’écran.
Chrome propose également, en option, un mode de navigation sécurisé optimisé par l’IA qui offre aux utilisateurs des protections supplémentaires contre les sites et contenus malveillants s’ils sont prêts à partager (en temps réel) avec Google les URL des pages web qu’ils visitent.
Microsoft progresse aussi sur la question des agents d’IA dans le navigateur
Lors de la conférence Build de Microsoft pour les développeurs, Microsoft a annoncé que les développeurs web seraient bientôt en mesure d’exploiter les capacités d’IA sur l’appareil grâce à un ensemble de nouvelles API qui permettent au navigateur Edge d’accéder au mini-modèle Phi-4 de Microsoft. Selon The Verge, « les développeurs web pourront ajouter des boîtes d’invite et offrir des outils d’aide à la rédaction pour la génération de texte, le résumé et l’édition ». Microsoft a également présenté trois autres fonctions d’IA pour Edge, dont une fonction de traduction de PDF.
Gemini-in-Chrome ne sera pas activé par défaut. Les utilisateurs doivent activer la fonctionnalité en cliquant sur l’étincelle Gemini (dans le coin supérieur droit de la capture d’écran ci-dessous). En réponse, Chrome lance un propt IA dans une fenêtre contextuelle qui ressemble à la fenêtre contextuelle de certaines extensions Chrome.
La fenêtre contextuelle Gemini-in-Chrome s’anime lorsque l’utilisateur clique sur l’icône Gemini Sparkle dans le coin supérieur droit d’une fenêtre Chrome. Capture d’écran par David Berlind/ZDNET
Bien qu’elle n’apparaisse pas dans la capture d’écran ci-dessus, la fenêtre contextuelle Gemini propose également des suggestions (basées sur l’onglet du navigateur actuellement ouvert) sous la forme de boutons cliquables.
Attention aux pop-up !
D’après les démonstrations observées par ZDNET, la dépendance de Gemini-in-Chrome à l’égard des fenêtres pop-up peut obliger les utilisateurs à redoubler de vigilance pour s’assurer que les fenêtres pop-up avec lesquelles ils travaillent sont d’authentiques fenêtres Gemini-in-Chrome et non des pop-up imposteurs provenant de sites web malveillants ou d’extensions de navigateur.
En réponse à la question de ZDNET sur l’absence de garanties visuelles concernant l’authenticité de la fenêtre pop-up de Gemini-in-Chrome, Tabriz a déclaré : « Vous avez raison. Il s’agit d’un nouveau concept de navigation et nous devrons être vigilant. Notre objectif est de donner l’impression qu’il s’agit d’une extension de l’interface utilisateur de Chrome ».
M. D’Silva a également évoqué certains indices visuels subtils de Gemini-in-Chrome qui sont « très difficiles à reproduire [pour les acteurs malveillants] ». L’un d’entre eux est un petit indicateur dans le coin supérieur droit du navigateur qui indique l’onglet avec lequel Gemini-in-Chrome est en train d’interagir.
Il incombe aux utilisateurs de se familiariser avec ces indices
D’autre part, des zones de contenu spécifiques de l’onglet concerné s’illuminent pour indiquer comment Gemini-in-Chrome interagit avec la page web. Néanmoins, du moins pour l’instant, il semble qu’il incombe aux utilisateurs de se familiariser avec ces indices afin de renforcer leurs propres défenses contre la possibilité d’une interaction erronée avec une fenêtre Gemini-in-Chrome potentiellement inauthentique.
Selon les responsables de la société, la capacité de Gemini-in-Chrome à apporter plus de clarté et de contexte au contenu web est principalement axée sur le texte et les images et exclut le contenu multimédia tel que la vidéo et l’audio.
Pour l’instant, Gemini-in-Chrome n’est disponible que pour les utilisateurs âgés de 18 ans ou plus et dans les versions de Chrome où l’anglais américain est sélectionné comme langue par défaut. Aucune date n’a été communiquée pour la disponibilité de Gemini-in-Chrome sur d’autres plateformes supportées par Chrome, telles qu’Android, iOS et Chromebook.