OpenAI dévoile GPT-5.4, un modèle présenté comme plus performant pour le travail professionnel et l’automatisation de tâches complexes. L’entreprise insiste en particulier sur ses capacités d’agent : l’IA peut utiliser directement un ordinateur, naviguer dans des logiciels et orchestrer des actions pour le compte de l’utilisateur.
Les grands acteurs de l’IA n’ont que le mot « agent » à la bouche, en affirmant que ces derniers sont capables de réaliser une série d’actions pour le compte de l’utilisateur, comme par exemple réserver un billet d’avion. Dans les faits, il faut se rendre à l’évidence : ces fameux agents sont en général bien lents et patauds, et il leur arrive de complètement passer à côté de leur mission.
L’IA d’OpenAI peut désormais utiliser un ordinateur
GPT-5.4 prend le pari de faire mieux. Le nouveau modèle lancé par OpenAI est le premier du genre à pouvoir utiliser directement un ordinateur, en cliquant dans des interfaces, saisir du texte et utiliser une souris, lire des captures d’écran ou naviguer sur des sites ou dans des logiciels. Les agents estampillés GPT-5.4 seraient donc en mesure d’exécuter des tâches complètes comme remplir des formulaires, envoyer des emails, gérer des calendriers ou manipuler des applications.
GPT-5.4 est plus efficace pour enchaîner plusieurs outils (qu’il peut aller chercher de manière dynamique) et paralléliser des actions. De fait, il devrait se montrer meilleur pour orchestrer des workflows, des flux de travail et d’actions.
Ça n’est pas tout. OpenAI annonce aussi que son nouveau modèle est le plus performant pour réaliser des tâches professionnelles complexes : produire des feuilles de calcul dans des tableurs, des présentations ou encore des documents structurés. L’entreprise indique que GPT-5.4 fait jeu égal ou dépasse des professionnels humains dans 83 % des cas d’après le benchmark GDPval qui simule des tâches réelles dans 44 métiers (finance, vente, santé, etc.). C’est 71 % pour GPT-5.2.
Le modèle se veut également plus fiable : les affirmations erronées et les hallucinations seraient 33 % moins fréquentes, et les réponses complètes contiendraient 18 % d’erreurs en moins. Les développeurs profiteront des capacités de GPT-5.4, qui intègre et améliore celles de GPT-5.3-Codex, le modèle spécialisé dans le code. Dans un exemple donné par OpenAI, GPT-5.4 peut créer un jeu de gestion de parc d’attractions complet dans le navigateur, puis utiliser des outils pour le tester automatiquement.
La recherche est annoncée comme plus performante, ce qui permet au modèle de parcourir plusieurs sources et de synthétiser l’information plus efficacement. La variante Thinking (raisonnement avancé) de GPT-5.4 est en cours de déploiement dans ChatGPT (pour les abonnés payants) ; pour les réponses rapides, c’est GTP-5.3 Instant qui prend la main.
👉🏻 Suivez l’actualité tech en temps réel : ajoutez 01net à vos sources sur Google, et abonnez-vous à notre canal WhatsApp.
Source :
OpenAI