Google vient d’annoncer Gemini 1.5, une grande mise à jour de son modèle d’intelligence artificielle. Cette nouvelle version permet à l’entreprise de gonfler les performances de son chatbot en s’appuyant sur une approche radicalement différente.
Fin de l’année dernière, Google a levé le voile sur Gemini, une nouvelle version de son modèle d’IA. Cette itération, disponible en plusieurs versions, est appelée à remplacer Google Assistant, et la transition a déjà débuté aux États-Unis. Lors de l’annonce du modèle d’IA en décembre, Google s’est engagé à proposer régulièrement des améliorations à Gemini.
Comme promis, l’entreprise américaine vient donc de présenter Gemini 1.5, une mise à jour majeure de l’intelligence artificielle. Dans le détail, la mise à jour s’articule autour de deux versions du modèle, Gemini 1.5 et 1.5 Pro.
Une approche radicalement différente
Avec ces nouveaux modèles, Google promet « des performances considérablement améliorées ». De l’aveu du PDG Sundar Pichai, la mise à jour représente un « changement radical dans notre approche ». Le géant de Mountain View explique s’appuyer sur l’architecture Mixture-of-Experts (MoE), un modèle de réseau de neurones qui comprend le concept de la spécialisation dans le traitement de l’information.
En clair, les informations peuvent être traitées par différentes parties du réseau en fonction des besoins. Ce changement permet d’améliorer la précision du modèle et de gonfler le nombre de paramètres. Dans ce cas de figure, toutes les sections du réseau neuronal ne doivent pas être activées pour répondre à toutes les requêtes. Comme le montrent les benchmarks, Gemini 1.5 est in fine nettement plus efficace que Gemini 1.0 Pro.
« Nos dernières innovations en matière d’architecture de modèle permettent à Gemini 1.5 d’apprendre des tâches complexes plus rapidement et de maintenir la qualité, tout en étant plus efficace », déclare Sundar Pichai.
Gemini 1.5 Pro, désormais aussi efficace que Gemini Ultra
Google n’a pas non plus lésiné sur les améliorations apportées à Gemini 1.5 Pro, « un modèle multimodal de taille moyenne », comme le décrit Sundar Pichai. Celui-ci joue désormais à armes égales avec Gemini Ultra 1.0, le plus grand modèle développé par Google à ce jour.
L’entreprise explique avoir revu à la hausse la capacité de traitement contextuel de l’IA, qui grimpe dorénavant à un million de jetons. À titre de comparaison, la précédente version de Gemini Pro ne dépasse pas les 128 000 jetons, tout comme GPT-4, le modèle derrière ChatGPT. La capacité de traitement contextuel fait référence à la faculté de l’IA à analyser et à comprendre le contexte dans lequel des données ou des informations sont mises en avant, pour en tirer des conclusions ou prendre des décisions pertinentes sans l’aide d’un utilisateur.
À lire aussi : Google admet avoir trafiqué une démo de l’IA Gemini
Des performances à la hausse
Grâce à ces améliorations, Gemini 1.5 Pro est en mesure de traiter jusqu’à une heure de vidéo, onze heures de contenus audio, plus de 30 000 lignes de code ou plus de 700 000 mots en une seule requête. Par exemple, lorsque l’IA reçoit « les transcriptions de 402 pages de la mission d’Apollo 11 sur la lune, elle peut raisonner sur les conversations, les événements et les détails trouvés dans le document ».
Comme le rappelle Sundar Pichai, ces innovations en matière d’IA sont encore expérimentales. Il précise que Google travaille « activement sur des optimisations pour améliorer la latence, réduire les exigences de calcul et améliorer l’expérience utilisateur ».
Dans un premier temps, Google donne uniquement l’accès à Gemini 1.5 Pro. Seuls les entreprises et les développeurs peuvent obtenir un accès à ce modèle d’IA. La firme préfère d’abord recueillir le retour d’expérience des professionnels avant d’envisager un déploiement à destination du grand public.
🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.
Par : Opera
Source :
Google