o3-mini d’OpenAI ouvre son capot et vous permet de voir le proces …

o3-mini d'OpenAI ouvre son capot et vous permet de voir le proces ...



OpenAI a publié son modèle o3-mini il y a exactement une semaine. La promesse ? Offrir aux utilisateurs gratuits et payants une alternative plus précise, plus rapide et moins chère que o1-mini.

Et voici qu’OpenAI met à jour le modèle o3-mini pour y inclure une « nouvelle chaîne de pensée ».

Et voici pourquoi c’est important.

Qu contient la mise à jour du modèle o3-mini

OpenAI a annoncé par le biais d’un billet X que les utilisateurs gratuits et payants seraient désormais en mesure de voir le processus de raisonnement par lequel l’o3-mini passe avant d’arriver à une conclusion. Par exemple, dans ce billet, un utilisateur demande « Comment se fait-il qu’aujourd’hui ne soit pas un vendredi ? » Le modèle décrit chaque étape de la chaîne de pensée qui lui a permis d’aboutir à sa réponse.

Comprendre comment le modèle est arrivé à la conclusion est utile car cela permet non seulement de vérifier l’exactitude de la conclusion. Mais aussi de savoir comment ils auraient pu arriver à cette réponse eux-mêmes. Cela est particulièrement utile pour les prompts de mathématiques ou de codage. Car le fait de voir les étapes peut vous permettre de les recréer la prochaine fois que vous rencontrerez un problème similaire.

Les abonnés payants de ChatGPT pourront également voir la nouvelle chaîne de pensée dans o3-mini avec l’option « raisonnement élevé ». Comme son nom l’indique, le « raisonnement élevé » permet simplement au modèle d’appliquer plus de puissance de calcul pour les questions complexes qui nécessitent un raisonnement complexe.

Qu’est-ce que la chaîne de pensée (CoT – Chain of Thought) ?

OpenAI utilise le terme « chaîne de pensée », mais qu’est-ce que cela signifie réellement ?

De la même manière que vous demanderiez à une personne d’expliquer son raisonnement étape par étape, le CoT encourage un LLM à décomposer un problème complexe en étapes logiques, plus petites et solubles. En partageant ces étapes de raisonnement avec les utilisateurs, le modèle devient plus facile à interpréter, ce qui permet aux utilisateurs de mieux orienter ses réponses et d’identifier les erreurs de raisonnement.

A savoir : la fonction Chain of Thought affiche normalement chaque étape intermédiaire en temps réel au fur et à mesure que le modèle raisonne sur un problème. Ici, OpenAI n’utilise pas exactement cette fonction. Elle résume le raisonnement. Dans les commentaires du post sur X, de nombreux passionnés d’IA ont exprimé leur mécontentement à l’égard de cette fonctionnalité. Pourquoi ? Parce que la CoT normalement présente des avantages supplémentaires, comme la possibilité de mieux orienter le modèle et de dépanner les raisonnements erronés.

Les raisons pour lesquelles OpenAI aurait pu opter pour le résumé de CoT est qu’il est plus facile à comprendre pour tout le monde. Et que l’exposition du CoT en temps réel pourrait rendre le modèle plus vulnérable aux tentatives de jailbreaking.

Comment accéder à o3-mini et la fonctionnalité CoT

Pour consulter la chaîne de pensée, vous n’avez rien d’autre à faire que de sélectionner le modèle o3-mini pour répondre à votre question.

Si vous êtes abonné, vous pouvez sélectionner « o3-mini » ou « o3-mini-high » dans le menu déroulant du modèle situé dans le coin supérieur gauche. Une fois le modèle sélectionné, le processus de raisonnement s’affichera automatiquement pour toutes les questions que vous poserez.

Si vous êtes un utilisateur gratuit, il vous suffit de cliquer sur « Raisonner » dans la zone de texte du message ou de régénérer une réponse pour activer o3-mini. Une fois que vous l’avez fait, vous pouvez simplement saisir un prompt comme d’habitude.





Source link

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.