La nouvelle IA chinoise de DeepSeek est aussi puissante que les modèles américains les plus avancés

La nouvelle IA chinoise de DeepSeek est aussi puissante que les modèles américains les plus avancés


Les grands fabricants occidentaux de modèles IA — OpenAI, Google, Anthropic… — ont tous livrés ces dernières semaines leurs dernières innovations en la matière. Mais la Chine n’est pas en reste : DeepSeek vient à son tour de dévoiler les dernières versions de ses propres modèles, tous open source, et aux performances similaires à celles de GPT-5 selon les benchmarks.

DeepSeek s’apprête-t-il à faire trembler de nouveau les grands acteurs américains de l’IA ? On se rappelle du coup de tonnerre du début d’année, lorsque la start-up chinoise a dévoilé son nouveau modèle IA baptisé R1. Non seulement il se montrait au même niveau que o1, qui était alors le modèle le plus avancé d’OpenAI, mais à une fraction du coût — et le tout proposé en open source.

L’open source peut rivaliser avec GPT-5

De l’eau a coulé sous les ponts depuis, et l’actualité a remis sur le devant de la scène les nouveaux modèles GPT-5.1, Gemini 3.0 ou encore Claude Opus 4.5 des Américains. Mais DeepSeek continuait de travailler dans l’ombre. Le laboratoire chinois revient donc aujourd’hui avec DeepSeek-V3.2, une mise à jour majeure de son modèle expérimental lancé en septembre.

La jeune pousse assure que cette nouvelle version atteint des performances similaires à celles de GPT-5 sur de nombreux tests de raisonnement, un terrain sur lequel seules quelques entreprises parviennent à rivaliser. DeepSeek explique que V3.2 n’est plus seulement un modèle de génération de texte. L’entreprise l’a doté d’une capacité supplémentaire : utiliser des outils, comme des moteurs de recherche, des modules de calcul, du code exécutable, en les intégrant directement dans ses mécanismes internes de « réflexion ».

© DeepSeek

Autrement dit, le modèle peut désormais basculer entre des modes de pensée avec ou sans utilisation d’outils, et décider lui-même quand y recourir. C’est la première fois qu’un modèle maison « intègre la réflexion directement dans l’usage d’outils ». Un positionnement qui rappelle les ambitions d’OpenAI ou d’Anthropic sur les agents capables d’agir de façon semi-autonome.

En parallèle, DeepSeek lance V3.2-Speciale, une déclinaison pensée pour les tâches nécessitant des chaînes de raisonnement longues. Objectif annoncé : « pousser les capacités d’inférence des modèles open source dans leurs retranchements » (c’est-à-dire leur aptitude à analyser une situation et à en déduire la suite logique) et explorer jusqu’où ces systèmes peuvent aller en mathématiques ou en algorithmique.

L’entreprise revendique là aussi des performances de pointe, comparables au Gemini-3 Pro de Google sur plusieurs benchmarks, y compris sur des épreuves de haut niveau comme l’Olympiade internationale de mathématiques ou l’Olympiade internationale d’informatique. Les modèles ouverts chinois veulent montrer qu’ils peuvent tenir tête aux géants américains dans des domaines parmi les plus complexes pour l’IA.

Enfin, DeepSeek dit avoir mis au point une nouvelle méthode d’entraînement destinée aux agents autonomes, ces programmes capables d’analyser un environnement et de prendre des décisions sans supervision constante. Une brique essentielle pour la prochaine génération d’outils intelligents, et un signal supplémentaire, s’il en était besoin, que la Chine a bien l’intention de jouer la mouche du coche.

👉🏻 Suivez l’actualité tech en temps réel : ajoutez 01net à vos sources sur Google Actualités, abonnez-vous à notre canal WhatsApp ou suivez-nous en vidéo sur TikTok.



Source link

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.