J’ai passé des heures à tester ChatGPT Tasks

J'ai passé des heures à tester ChatGPT Tasks


Retravailler un prompt quiChatGPT Tasks est une nouvelle fonctionnalité beta pour les versions payantes de ChatGPT. Elle permet de programmer l’exécution d’un prompt à une certaine heure.

Dans cet article, je vais expliquer cette fonctionnalité. Ensuite, je vous montrerai le processus incroyablement frustrant qui consiste à essayer de faire faire à ChatGPT ce que vous voulez qu’il fasse.

Dans cette série de tests, ChatGPT s’est montré singulièrement peu coopératif. Je vous explique.

Comment fonctionne ChatGPT Tasks

Les Tasks sont des prompts qui sont déclenchés à un moment donné. Ils peuvent se produire une seule fois ou se répéter. Par exemple, vous pouvez dire : « Demain à 10h30, dites-moi le temps qu’il fait », et ChatGPT traitera le prompt « dites-moi le temps qu’il fait ».

ChatGPT affichera une notification dans le navigateur (si vous l’avez activée) et/ou vous enverra un e-mail.

Pour activer les tâches, vous devez disposer d’un compte payant Plus (ou plus) pour ChatGPT, et vous devez sélectionner le modèle GPT-4o avec tâches planifiées.

Capture d’écran par David Gewirtz/ZDNET

Comment paramétrer ChatGPT Tasks

Une fois que vous êtes dans ce modèle, vous pouvez invoquer la planification des tâches dans votre invite avec quelque chose comme l’énoncé  » at  » ou le préfixe  » schedule a task  » (planifier une tâche). Il semble que ChatGPT interprète assez bien tout ce qui implique une demande de temps futur comme une tâche.

J’ai pu assigner une tâche à la fois dans l’application Mac et dans l’interface du navigateur, mais je n’ai pu voir et gérer les tâches existantes que dans l’interface du navigateur. Sous l’image de profil, à droite de l’écran, vous pouvez sélectionner Tâches dans le menu déroulant.

tasks-menu

Capture d’écran par David Gewirtz/ZDNET

Vous accédez alors à un écran de tâches où vous pouvez voir les tâches que vous avez planifiées et celles qui ont été accomplies.

tasks-screen

Capture d’écran par David Gewirtz/ZDNET

En survolant l’heure, vous verrez apparaître un crayon et trois points. Pause empêche l’exécution d’une tâche mais la laisse à votre disposition. Supprimer la supprime.

hover

Capture d’écran par David Gewirtz/ZDNET

Comment modifier les Tasks

Le crayon vous donne accès à un écran d’édition qui vous permet de réviser la tâche avant sa prochaine exécution.

task-box

Capture d’écran par David Gewirtz/ZDNET

Vous pouvez ici renommer la tâche, modifier le prompt et changer sa planification.

Pour autant que je puisse en juger, ces fonctionnalités tournent assez bien dans la version bêta.

J’ai eu une tâche qui ne s’est jamais exécutée, et une autre qui s’est exécutée dix heures après la date prévue. Mais la plupart d’entre elles semblent s’être déroulées comme prévu.

La porte d’entrée de l’IA agentique

À première vue, l’ajout de tâches à ChatGPT semble peu intéressant. Après tout, nous disposons depuis des années de gestionnaires de tâches très complets et performants.

Mais si ChatGPT Tasks fait beaucoup moins que les gestionnaires de tâches, il peut aussi faire plus. Il peut exécuter un prompt d’IA. Cela signifie qu’il peut prendre automatiquement des mesures intelligentes à un moment précis ou à des moments ultérieurs.

Pour l’instant, l’action est assez limitée. Il peut traiter un prompt, mais son seul résultat est un courriel ou une notification du navigateur. Néanmoins, cela nous donne une idée de la manière dont l’intelligence peut être intégrée dans une action chronométrée.

Tentative d’obtenir un bulletin d’information quotidien

Le premier problème, c’est que les IA aiment inventer des choses. Elles suivent également des instructions, en ce sens qu’elles répondent à des prompts, mais le résultat est complètement ou subtilement erroné.

J’ai essayé de créer une Task pour générer un bulletin d’information quotidien. Mais en fait il refuse simplement de faire ce que je veux.

J’ai essayé de faire en sorte que ChatGPT me donne des articles d’actualité, avec leurs sources. Parfois, il se contentait de les inventer. Ou il m’a donné des sources et des articles datant d’un an. Parfois, il citait des articles censés provenir d’un seul site, mais qui provenaient de sites complètement différents. Certains liens censés traiter d’un sujet précis pointaient en fait vers un endroit totalement différent.

J’ai essayé de faire en sorte que ChatGPT valide ses sources. De lui faire revérifier son travail. J’ai essayé de réduire ses choix ou de lui fournir des instructions plus claires et plus spécifiques. Sans succès.

Ma conclusion est la suivante : ChatGPT est capable de faire des recherches sur le web. Et il est capable de trouver certains sujets. Mais si vous voulez les nouvelles du jour et que vous voulez qu’elles soient vérifiables (en termes d’histoire réelle avec un lien réel), ChatGPT n’est pas prêt.

Générer un bulletin météo personnalisé

J’ai ensuite essayé d’obtenir un bulletin météo quotidien. Là encore, je voulais quelque chose de plus qu’un simple bulletin météo.

Je voulais que ChatGPT ajoute de la valeur à la météo. Je voulais qu’il dessine une image représentant le temps qu’il faisait au moment où le prompt était exécuté.

Avant d’essayer d’assigner un prompt à un moment futur, j’ai d’abord travaillé et affiné le prompt principal lui même. C’est important. Assurez-vous que le prompt fonctionne avant de la confier à l’agent de planification.

Je voulais un briefing bien formaté, avec une image représentative. Après de nombreuses séries d’améliorations, voici ce que j’ai obtenu.

good-brief

Capture d’écran par David Gewirtz/ZDNET

Sympa, hein ? C’est le bâtiment du capitole de l’État de Salem, dans l’Oregon.

Voici le prompt que j’ai utilisé pour créer ce bulletin météo personnalisé

Exécutez strictement les étapes suivantes et produisez les résultats séquentiellement:

  1. Imprimez une ligne contenant le texte : « Votre bulletin météo quotidien » en titre 2 caractères gras.
  2. Générer une image DALL-E qui représente visuellement le temps qu’il fait aujourd’hui à Salem, Oregon. L’image doit inclure des éléments relatifs à la météo (par exemple, pluie, ciel ensoleillé) et un point de repère reconnaissable comme le Capitole de l’État de l’Oregon. Affichez immédiatement l’image.
  3. Imprimez un titre : « Le temps qu’il fait aujourd’hui », suivi des conditions météorologiques et de la température pour Salem, Oregon, aujourd’hui.
  4. Imprimez un titre : ‘Lever/coucher du soleil’ suivi des heures de lever et de coucher du soleil pour Salem, Oregon, aujourd’hui.
  5. Imprimez un titre : ‘Qualité de l’air’ suivi de la qualité de l’air pour Salem, Oregon, aujourd’hui
  6. Imprimez un titre : ‘Avis’ suivi de tous les avis pour Salem, Oregon, aujourd’hui. S’il n’y a pas d’avis, afficher « Pas d’avis aujourd’hui « .
  7. Imprimez un titre : ‘Transport’ suivi de toutes les recommandations pour Salem, Oregon, aujourd’hui : ‘Transport’ suivi d’éventuelles recommandations pour les déplacements à Salem, Oregon, aujourd’hui, notamment en fonction des conditions météorologiques.
  8. Imprimez un titre : Activités de plein air » suivi de recommandations sur les activités de plein air à Salem, Oregon, en fonction du temps qu’il fait aujourd’hui.

Ne passez pas à l’étape suivante tant que l’étape précédente n’est pas terminée. Réessayez toujours la génération d’images en cas d’échec.

Retravailler un prompt et le tester m’a pris plus de deux heures

Il m’a fallu deux bonnes heures pour que ChatGPT fasse cela de manière fiable. Notez la première ligne, où je lui demande d' »effectuer les étapes de manière stricte » et de « produire les résultats de manière séquentielle ». L’utilisation de « strictement » a été recommandée par ChatGPT lorsque je lui ai demandé pourquoi il ne suivait pas les instructions.

J’ai rencontré un tas de problèmes en essayant de générer l’image. L’étape 2 indique clairement qu’il faut utiliser DALL-E. J’ai trouvé que « représente visuellement » convainquait l’IA d’utiliser les conditions actuelles avec le thème pour produire une nouvelle image. J’ai également demandé à l’IA d’inclure un point de repère, car toutes les autres images générées étaientdes petites villes avec de grands arbres, comme celle-ci.

trees

Capture d’écran par David Gewirtz/ZDNET

Le logiciel a également confondu les degrés Celsius et Fahrenheit. Et, bien sûr, « droize ». DALL-E a donc inventé un mot.

Enfin, j’ai eu du mal à faire en sorte que ChatGPT génère l’image. « Ne passez pas à l’étape suivante tant que l’étape précédente n’est pas terminée. Réessayez toujours de générer l’image en cas d’échec », a semblé résoudre le problème.

À ce stade, j’avais donc un prompt qui fonctionnait de manière fiable dans ChatGPT. Il était temps d’en faire un Task.

Agentifier la tâche

Pour ce faire, tout ce que j’ai fait est d’ajouter « A 9h30 aujourd’hui » au début du prompt. Pour la répéter, il suffit de remplacer « aujourd’hui » par « tous les jours ».

Puis, à l’heure dite, j’ai reçu un courriel dans ma boîte de réception.

email

Capture d’écran par David Gewirtz/ZDNET

J’ai cliqué sur Afficher le message et j’ai obtenu le résultat ci-dessous à gauche. Remarquez qu’il est question de 50 degrés – mais nos températures locales n’ont pas dépassé 40 degrés aujourd’hui. C’est tout de même une belle image.

variations

Capture d’écran par David Gewirtz/ZDNET

Notez également que l’IA a décidé d’ajouter le mot « step » avec chaque numéro d’étape à chaque phase. J’ai effectué une deuxième exécution avec exactement le même prompt et j’ai obtenu la version ci-dessus à droite.

J’ai ensuite passé les trois heures suivantes à essayer de convaincre ChatGPT de ne pas inclure les étapes dans le rendu. Parfois, j’obtenais une image. Parfois non.

Pas prêt pour la mise en production

Pour être honnête, OpenAI qualifie cette fonctionnalité de bêta. Et bon sang ne saurait mentir, c’est une version bêta. D’un côté, l’idée d’un agent d’IA capable de faire des choses comme dessiner une image représentative d’un certain ensemble de données semble intrigante. D’un autre côté, l’idée d’un agent d’intelligence artificielle qui refuse de suivre des instructions et s’égare dans toutes sortes de directions est terrifiante.

Au moins, avec les algorithmes non IA, si notre code déraille, c’est de notre faute en tant que programmeurs.

Mais lorsqu’il s’agit d’agents basés sur l’IA, vous ne pouvez pas vraiment soumettre vos opérations agentiques à des suites de tests complètes. L’IA agira différemment en fonction des données qu’elle reçoit.

Au fur et à mesure que les IA s’améliorent (nous ne pouvons qu’espérer, n’est-ce pas ?), nous devrions être en mesure de lancer de petits agents qui construisent un briefing quotidien.

Mais des agents d’IA qui contrôlent les machines, l’internet des objets, la sécurité, les armes et d’autres opérations inquiétantes dans le monde réel ? Je ne suis pas favorable à cette idée tant que nous n’aurons pas un contrôle beaucoup plus complet sur les IA.

Sinon, une demande telle que « contrôler mon environnement domestique pour que je puisse dormir toute la nuit » pourrait bien aboutir à ce que les IA nous tuent pendant que nous dormons. Ce qui serait leur façon de suivre nos instructions avec enthousiasme !

Et vous ? Êtes-vous impatient d’essayer les tâches de ChatGPT ou êtes-vous plus convaincu que jamais que nous devrions aller vivre dans une yourte dans les bois ? Faites-le nous savoir dans les commentaires ci-dessous.



Source link

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.