La semaine dernière, Sam Altman, PDG d’OpenAI, a annoncé le lancement d’une nouvelle fonctionnalité. Il s’agissait d’une mise à jour massive de ChatGPT introduisant de nouvelles capacités de mémoire. Cette semaine, c’est une nouvelle famille de modèles d’OpenAI qui fait son entrée.
Une nouvelle famille de modèles réservée aux développeurs
OpenAI vient de dévoiler une nouvelle famille de modèles : GPT-4.1, GPT-4.1 mini et GPT-4.1 nano. Selon l’entreprise, cette famille de modèles offre des améliorations en matière de codage, de suivi des instructions et de compréhension du contexte long, et surpasse GPT-4o et GPT-4o mini « sur tous les plans ».
Ces modèles ont été spécialement conçus pour les développeurs et, par conséquent, ne seront disponibles que via l’API.
OpenAI affirme que les modèles GPT-4.1 ont été développés à partir des retours des développeurs afin d’améliorer leurs points forts, comme le respect de formats fiables, la structure et l’ordre des réponses, le codage front-end, etc.
L’un des principaux avantages est leur latence réduite, même avec des performances supérieures lors des évaluations d’intelligence, comme le benchmark multilingue (MMLU), présenté ci-dessous.
© OpenAI
Un modèle moins cher
Les modèles sont également rentables, ce qui répond à un problème majeur pour les développeurs.
OpenAI a indiqué que GPT-4.1 est 26 % moins cher que GPT-4o en termes de requêtes médianes, et qu’il s’agit du modèle le plus rapide et le plus abordable lancé par l’entreprise à ce jour. De plus, GPT-4.1 mini réduit les coûts de 83 %, selon OpenAI.
Parmi les autres améliorations se trouvent des fenêtres de contexte plus larges, qui correspondent à la quantité de jetons que le modèle peut traiter en entrée et en sortie. Les modèles GPT-4.1 prennent en charge jusqu’à un million de jetons. À titre de référence, les modèles o1 et o3-mini de l’API ont une longueur de contexte de 200 Ko, tandis que GPT-4.5 et GPT-4o ont une longueur de contexte de 128 Ko.
OpenAI affirme que la compréhension du contexte étendu, associée à des améliorations du suivi des instructions, rend les modèles GPT-4.1 plus efficaces pour l’IA agentique. En termes simples, les agents IA sont des systèmes capables d’effectuer des tâches pour vous de manière autonome, sans instructions sur la manière d’effectuer chaque étape.
La fin pour GPT-4.5
Les nouveaux modèles offrant des performances similaires, voire supérieures, à un coût inférieur à celui de GPT-4.5, OpenAI a décidé d’abandonner ce dernier et de se concentrer sur le développement de futurs modèles. Afin de laisser aux développeurs le temps nécessaire pour la transition, GPT-4.5 Preview sera désactivé le 14 juillet 2025.
Bien que les nouveaux modèles GPT-4.1 ne soient pas disponibles dans le sélecteur de modèles ChatGPT, la dernière version de GPT-4o du chatbot inclut bon nombre des mêmes améliorations.