Google dévoile Gemini 3, son modèle d’intelligence artificielle le plus avancé à ce jour. Plus performant que jamais, il comprend mieux le texte, les images et les vidéos, automatise des tâches complexes et explose tous les benchmarks.
Comme on s’y attendait, Google vient de lever le voile sur Gemini 3. Sans grande surprise, le géant de Mountain View décrit Gemini 3 comme son modèle le plus intelligent et ambitieux à ce jour. Deux ans après avoir levé le voile sur la première version de son IA, et huit mois à peine après la version 2.5 Pro, Google introduit une troisième itération plus intelligente et plus puissante.
À lire aussi : Gemini pour Android accueille trois nouveautés qui sautent aux yeux
Quelles sont les nouveautés de Gemini 3 ?
Google précise que Gemini 3 se distingue d’abord par une meilleure compréhension multimodale. En clair, l’IA est encore meilleure pour comprendre et générer du texte, des images, des sons, des vidéos et même du contenu 3D. Gemini 3 se débrouille nettement mieux lorsqu’il faut croiser plusieurs types de données. C’est une avancée majeure par rapport aux versions précédentes.
Ensuite, la nouvelle version du modèle offre de meilleures capacités de raisonnement. Gemini 3 permet de résoudre des problèmes plus complexes, d’analyser de grandes quantités d’informations et de comprendre l’intention réelle derrière chaque requête de l’utilisateur.
« En seulement deux ans, l’IA est passée de la simple lecture de textes et d’images à la compréhension de situations et de contextes », explique Sundar Pichai, PDG de Google.
Notez que la nouvelle version de Gemini prend en charge jusqu’à 1 million de tokens pour traiter de longues conversations ou documents, ce qui facilite l’analyse de gros volumes de données. Google met aussi en avant une compréhension du contexte nettement améliorée, permettant aux utilisateurs de s’exprimer avec des instructions plus simples tout en étant compris par l’IA.
L’IA excelle aussi dans la production de code (SVG, JavaScript…), créer des interfaces dynamiques ou encore automatiser la production de documents. Google prend l’exemple de la création de livres de recettes à partir de notes manuscrites, ou d’analyses de vidéos à partir de matchs sportifs filmés. En miroir de ChatGPT Agent ou encore de Manus, Gemini 3 excelle dans l’automatisation de tâches. De nouveaux outils permettent en effet d’automatiser des tâches complexes, ou d’organiser intelligemment des emails ou des calendriers.
Mettant en avant les benchmarks, Google affirme que Gemini 3 est l’IA la plus puissante jamais conçue. Gemini 3 Pro a en effet obtenu les meilleurs scores sur plusieurs classements comme LMArena et Humanity’s Last Exam.
Une version preview et une version Deep Think
Gemini 3 est déployé dans plusieurs des produits et des plateformes de Google, dont la recherche en ligne, l’app Gemini, les outils pour développeurs, comme AI Studio, Antigravity ou Gemini CLI, ou encore les outils cloud pour entreprises, tels que Vertex AI ou Gemini Enterprise. Il s’agit pour le moment d’une version « preview ».
Dans le détail, Google déploie deux versions de Gemini 3. Outre la version Preview, Google lance une version Deep Think, une itération taillée pour offrir un meilleur raisonnement. Google assure que cette version est capable de réfléchir à plusieurs sujets en même temps. Actuellement réservée à certains testeurs, elle sera déployée dans les semaines à venir à tous les usagers. Par contre, on remarquera que Google n’a pas encore annoncé de nouvelle version de nano-banana, son générateur d’images. Avec Gemini 3, Google répond directement à la sortie de ChatGPT 5.1, qui ne remonte qu’à quelques jours.
👉🏻 Suivez l’actualité tech en temps réel : ajoutez 01net à vos sources sur Google Actualités, abonnez-vous à notre canal WhatsApp ou suivez-nous en vidéo sur TikTok.