OpenAI met désormais à disposition GPT-4.1 aux abonnés de ses servicesChat GPT Plus, Pro et Team.
GPT-4.1 n’était jusqu’alors disponible que pour les utilisateurs de l’API.
Un peu de définition de vocabulaire de l’IA et d’OpenAI
Puisque je vous lance tout un tas de mots à la mode, passons une minute à déconstruire tous ces termes.
- GPT-4.1 est un grand modèle de langage (LLM). Imaginez qu’il s’agit du moteur de votre voiture. Un moteur plus puissant peut avoir plus de puissance. Mais même un moteur moins puissant peut faire avancer la voiture. Chacune des versions de GPT fait référence à des modèles d’IA plus ou moins puissants.
- ChatGPT est l’interface de chat. C’est le logiciel qui prend en compte vos messages, les envoie au LLM et vous montre les résultats. Dans notre analogie, ChatGPT est la voiture. Et GPT-4.1 (ou GPT-4o, ou GPT-3.5) est le moteur.
- L’API (ou interface de programmation d’applications) est la manière dont les programmes communiquent avec d’autres programmes. Dans le cas des GPT, c’est la manière dont les programmes de nombreuses entreprises peuvent faire appel à un LLM pour obtenir des résultats. Une analogie très approximative, ce sont les câbles entre le tableau de bord et le moteur d’une voiture.
- OpenAI est l’entreprise qui fabrique les GPT et le chatbot. C’est comme Peugeot. Peugeot fabrique des voitures, mais vend également des moteurs à d’autres entreprises, qui les intègrent dans leurs propres véhicules. De la même manière, OpenAI fabrique ChatGPT, mais elle vend également des licences pour ses grands modèles de langage à tous les développeurs qui veulent de l’IA sans avoir à l’écrire à partir de zéro.
Ma fameuse analogie entre OpenAI et Peugeot
Voilà qui devrait vous mettre la puce à l’oreille. En avril, OpenAI a publié GPT-4.1 pour que les développeurs puissent l’utiliser via l’API. C’est à peu près l’équivalent de Peugeot qui sort un nouveau moteur, mais qui ne le vend qu’aux mécaniciens pour qu’ils l’installent dans des voitures qui ne sont pas des Peugeot.
Aujourd’hui, OpenAI publie GPT-4.1 pour une utilisation dans ChatGPT. C’est un peu comme si Peugeot vendait le moteur aux acheteurs de voitures Peugeot comme une option de mise à niveau lorsqu’ils achètent leur nouvelle 3008.
Les abonnements Plus, Pro et Team sont les versions payantes de ChatGPT, qui proposent de meilleures fonctionnalités ou davantage de possibilités d’utilisation que la version gratuite. Malheureusement, je n’ai pas de bonne analogie avec une voiture pour vous expliquer !
Comprendre les versions GPT
La réponse la plus simple est que GPT-4.1 est la nouvelle et meilleure version de GPT, qui dépasse les performances de la version plus classique GPT-4o.
Accordez-moi une minute. Il est temps de vous faire mal au cerveau.
Il y a eu GPT-1 et ensuite GPT-2. C’était logique. Mais depuis, OpenAI a publié des GPT appelés GPT-3.5, GPT-3.5 Turbo, GPT-4 Turbo, GPT-4o, GPT-4o Mini, o1, o1-mini (avec un tiret, « m » minuscule), o1 pro (sans tiret), o3-mini, o3-mini-high, GPT-4.5, GPT-4.1 (qui est plus récent que GPT-4.5, parce que, allez savoir pourquoi), o3, o4-mini, o4-mini-high.
OpenAI. À quoi pensez-vous, bon sang de bonsoir ?
N’essayez donc pas de comprendre la place d’un GPT par rapport à un autre en fonction de son numéro de version.
Aujourd’hui, nous allons principalement parler de deux modèles, GPT-4o et GPT-4.1. GPT-4o est la version entièrement multimodale (texte, images, audio en entrée et en sortie) de GPT qui est utilisée par les clients payants de ChatGPT depuis environ un an. Les utilisateurs gratuits utilisent également GPT-4o, mais avec des restrictions (les utilisateurs gratuits ne peuvent pas demander à ChatGPT de générer des images, par exemple).
Mais qu’est-ce que GPT-4.1 ?
La grande nouvelle est que GPT-4.1 est meilleur pour les tâches liées au développement de logiciels. Je n’ai pas encore eu l’occasion de tester cela en pratique. Mais je vais partager avec vous certains résultats des tests d’OpenAI et quelques anecdotes d’utilisateurs d’API qui sont passés de GPT-4o à GPT-4.1.
OpenAI effectue une série de tests pour évaluer la précision dans divers domaines, notamment le codage, le suivi des instructions et le contexte long.
Source : OpenAI David Gewirtz/ZDNET
Pour le codage, c’est assez explicite.
Le suivi des instructions indique dans quelle mesure l’IA suit les instructions. Par exemple, mon chiot a un taux de suivi des instructions inférieur à 1 % (à moins qu’il n’y ait une friandise). GPT-4.1 a obtenu un score de 38,3 %. C’est à dire le vrai pas beaucoup plus que mon chien. C’est une chose à garder à l’esprit lorsque l’on se fie à une IA.
A intégrer à vos GPT personnalisés
Le contexte long implique l’ampleur du défi. Cela permet de juger de la capacité d’une IA à examiner des problèmes de grande ampleur, sur différents types de supports, et à produire un résultat.
Dans tous les cas, un chiffre élevé est préférable. Et GPT-4.1 a des chiffres plus élevés que GPT-4o.
OpenAI a partagé quelques déclarations de programmeurs utilisant l’API du LLM sur la précision du GPT-4.1.
- Parul Pandey déclare : « GPT-4.1 lit moins de fichiers inutiles, écrit moins de modifications inutiles et parle moins. » Je suis tout à fait d’accord pour une réduction du blabla !
- Phil Franco dit : « Je viens d’essayer le contexte 1M sur GPT-4.1 avec l’ensemble du code de mon projet. J’ai trouvé des bogues dont je ne soupçonnais pas l’existence et j’ai suggéré des améliorations de l’architecture qui auraient pris des semaines à trouver. »
- Karen Puah déclare : « GPT-4.1 est plus obéissant, plus apte à rester conforme à la tâche, très à l’aise avec les outils et les données longues, et capable de résoudre les problèmes de manière autonome avec les bonnes instructions. Si vous travaillez sur un GPT personnalisé, un agent autonome, un assistant de code ou un chatbot d’entreprise, cette mise à jour est de l’or en barre ».
Le résultat final de GPT-4.1 semble être plus de la même chose, mais en mieux. Étant donné que l’offre améliorée est désormais intégrée à toutes les versions payantes de ChatGPT – pour ceux qui contribuent au flux de revenus mensuels de 415 millions de dollars d’OpenAI -, mieux c’est mieux.