DeepSeek a dévoilé deux nouveaux modèles : DeepSeek V4 Flash et DeepSeek V4 Pro. Ce dernier serait capable de traiter 1 million de caractères en un coup. Ce lancement s’inscrit dans la compétition entre la Chine et les États-Unis dans le domaine de l’IA open source.
DeepSeek a annoncé « l’ère du contexte d’un million de caractères à moindre coût ». Deux modèles ont été présentés : DeepSeek V4 Pro et DeepSeek V4 Flash. Le premier, multimodal, serait capable de mémoriser et de comprendre un million de caractères en un coup, tandis que le second est moins performant, mais plus économique.
Un nouveau modèle décliné en deux versions
DeepSeek a annoncé dans un communiqué publié sur le réseau social chinois WeChat : « Aujourd’hui, la pré-version de notre toute nouvelle série de modèles, DeepSeek V4, est officiellement mise en ligne et publiée en open source ». Concrètement, ce nouveau modèle se décline en deux versions : DeepSeek V4 Pro et DeepSeek V4 Flash.
Le modèle DeepSeek V4 Pro, multimodal, est capable de traiter des textes, des images et des vidéos. L’entreprise explique que « par rapport à la génération précédente, les capacités d’agent de DeepSeek V4 Pro ont été nettement renforcées ». Mais c’est sans doute son traitement de textes qui impressionne le plus. L’entreprise chinoise explique que son modèle : « dispose d’un contexte ultra-long d’un million de caractères ».
En d’autres termes, le modèle peut mémoriser et comprendre un million de caractères en un coup. Ainsi, si on lui donne des centaines de pages, il sera capable d’assimiler l’entièreté du corpus en un temps record et il pourra répondre à n’importe quelle question sur le contenu. DeepSeek assure avoir rendu ce procédé plus rapide et moins cher. Sa capacité à traiter de longs textes serait « parmi les meilleures au monde ». En ce qui concerne DeepSeek V4 Flash, il s’agit d’un modèle moins performant mais plus « économique ».
IA open source : la guerre entre la Chine et les États-Unis continue
Le lancement de DeepSeek V4 Pro s’inscrit dans un contexte particulier. Début avril, Google annonçait le lancement de la famille Gemma 4, soit 4 modèles open source. L’entreprise américaine se targuait alors du fait que ses modèles Gemma 4 26B et Gemma 4 31B Dense étaient plus puissants que le modèle Deepseek-v3.2-exp-thinking de l’entreprise chinoise. Il faudra maintenant voir comment se positionnera DeepSeek V4 Pro par rapport à ces deux modèles open source de Google.
Quoi qu’il en soit, la Chine continue de se positionner comme un leader dans l’intelligence artificielle open source, tout en s’imposant au passage comme la championne mondiale du recyclage d’appareils électroniques.
👉🏻 Suivez l’actualité tech en temps réel : ajoutez 01net à vos sources sur Google, et abonnez-vous à notre canal WhatsApp.
Source :
Le Monde