L’énorme succès de ChatGPT, qui a atteint 100 millions d’utilisateurs en deux mois et généré un engouement pour l’intelligence artificielle générative, a suscité des attentes. Depuis plusieurs mois, les spécialistes du numérique et les médias spéculaient sur le lancement de GPT-4, le modèle de traitement du langage censé succéder à GPT 3,5, sur lequel s’appuie le robot conversationnel ChatGPT. Après plusieurs rumeurs, ce logiciel d’intelligence artificielle a finalement été dévoilé, mardi 14 mars, par OpenAI, l’entreprise devenue spécialiste de ces modèles capables de générer des textes bluffants à partir de questions ou de requêtes écrites.
Écouter aussi ChatGPT : gadget ou révolution de l’intelligence artificielle ?
Pour vanter son progrès, OpenAI met en avant que GPT-4 a obtenu un score de 90 % à un test pour devenir avocat aux Etats-Unis. GPT-3,5, lui, n’avait pas dépassé la note de 10 %, souligne l’entreprise. Toutefois, les attentes des plus enthousiastes ont été quelque peu douchées : GPT-4 est certes, comme prévu, « multimodal », c’est-à-dire qu’il est capable de recevoir des images – en plus du texte – dans ses requêtes.
Cependant, cette fonctionnalité n’est pas encore opérationnelle dans la version dévoilée. De plus, cette dernière n’est pas, à ce stade, accessible au grand public, comme ChatGPT, mais limitée pour l’heure à quelques testeurs, en version payante, avec une liste d’attente, et à quelques entreprises qui souhaitent s’en servir pour développer des services, par le biais d’une interface (API). Enfin, GPT-4 n’échappe pas à certains travers des robots conversationnels, tels que les erreurs factuelles, même s’ils sont un peu réduits.
« Dans une conversation courante, la distinction entre GPT-3,5 et GPT-4 peut être subtile, reconnaît OpenAI dans sa présentation. La différence apparaît quand la complexité de la tâche atteint un certain seuil. GPT-4 est plus fiable, créatif et capable de gérer des instructions plus nuancées que GPT-3,5. » Les requêtes soumises au modèle par l’utilisateur peuvent désormais aller jusqu’à 25 000 mots, ce qui permet d’y inclure des documents entiers, afin d’en obtenir une analyse, une comparaison ou un résumé, par exemple.
GPT-4 répond mieux aux questions demandant un « raisonnement », assure aussi OpenAI. Ainsi, il sait trouver un créneau horaire pour caler une réunion entre trois participants quand on lui donne un paragraphe décrivant leur emploi du temps. Il serait aussi plus performant que ses concurrents dans la gestion de langues non anglaises, et même rares.
Politique de communication moins transparente
Il vous reste 66.16% de cet article à lire. La suite est réservée aux abonnés.