Mise à jour majeure pour le modèle d’IA V3 de DeepSeek

Mise à jour majeure pour le modèle d'IA V3 de DeepSeek


La startup chinoise DeepSeek fait de nouveau parler d’elle. Cette fois avec une version mise à jour de son modèle V3, publié en décembre.

Mardi, la société a officiellement annoncé V3-0324, nommé d’après le mois et le jour de sa sortie.

Un jour plus tôt, DeepSeek avait téléchargé le nouveau modèle sur HuggingFace. Mais avec peu d’informations supplémentaires.

Quelles sont les nouveautés du modèle V3-0324 de DeepSeek ?

Tout comme R1 – le modèle le plus performant de DeepSeek publié en janvier et un concurrent d’OpenAI – la nouvelle version est open source (en ce sens que ses poids sont publiés, mais pas son code réel) sous une licence MIT.

Dans un post sur X, DeepSeek note que la mise à jour montre de meilleures compétences de codage pour le développement web et une « augmentation majeure des performances de raisonnement ». Mais il recommande toujours de l’utiliser pour des tâches de raisonnement moins complexes. R1 reste le meilleur modèle de raisonnement du laboratoire, se classant à la quatrième place sur le Chatbot Arena.

DeepSeek a déclaré que la mise à jour montre aussi une amélioration des performances par rapport à la V3 sur plusieurs benchmarks standard, notamment le benchmark mathématique AIME (American Invitational Mathematics Examination), avec un score supérieur de près de 20 points.

DeepSeek

Alors que les tests de référence sont devenus trop faciles pour la plupart des modèles, un problème connu sous le nom de saturation des tests de référence, l’AIME est toujours considéré comme plus difficile que la plupart des autres. En janvier, Scale AI et le Center for AI Safety (CAIS) ont publié Humanity’s Last Exam pour lutter contre cette saturation.

Cela dit, parce qu’elles sont basées sur le contenu mathématique de l’enseignement secondaire, les réponses d’AIME sont publiquement disponibles en ligne. Cela qui signifie qu’elles peuvent être incluses dans les données d’entraînement.

Selon DeepSeek, d’autres améliorations ont été apportées, notamment un style d’écriture « amélioré » et une meilleure qualité, en particulier pour les contenus plus longs. Certains commentateurs de Reddit spéculent que la publication de la mise à jour pourrait préfigurer l’arrivée de R2, qui devrait être aussi perturbatrice que R1.

Comment essayer le modèle V3-0324 de DeepSeek

Vous pouvez accéder à V3-0324 dès maintenant via HuggingFace. Ou directement sur le site Web et l’application de DeepSeek.

Bien que vous souhaitiez d’abord prendre en compte les principales failles de sécurité et les problèmes de confidentialité des utilisateurs.

Alors que les versions V3 et R1 se sont révélées très faciles et dangereuses à casser, on ne sait pas encore si DeepSeek a ajouté des couches de sécurité dans la version V3-0324.



Source link

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.