*Parfois, j’ai l’impression que les chatbots d’IA sont modelés sur les adolescents. Ils peuvent être très, très bons. Mais d’autres fois, ils racontent des mensonges. Ils inventent des choses, fabulent. Ils donnent des réponses avec assurance. Mais ils se trompent lourdement.
Mais alors que la plupart d’entre nous savent qu’il ne faut pas s’adresser à des adolescents pour obtenir des informations et des conseils importants, nous nous fions à des IA tout aussi prévaricatrices.
L’année dernière, je vous ai donné huit façons de réduire les hallucinations de ChatGPT :
- Éviter l’ambiguïté et le flou
- Ne pas fusionner des concepts sans rapport entre eux
- Éviter de décrire des scénarios impossibles
- Ne pas utiliser des entités fictives ou fantastiques
- Éviter de contredire des faits connus
- Ne pas utiliser de manière abusive des termes scientifiques
- Éviter de mélanger des réalités différentes
- Ne pas attribuer des propriétés non caractéristiques
Cependant, ces conseils sont tous des choses à éviter. Je ne vous ai pas donné d’outils pour améliorer les réponses et guider l’IA afin qu’elle fournisse des réponses plus productives. Et cela est particulièrement important si vous comptez utiliser une IA pour remplacer un moteur de recherche ou pour vous aider à rédiger du contenu.
Examinons cinq mesures clés que vous pouvez prendre pour guider l’IA vers des réponses précises.
1. Demander des références et des sources
J’ai déjà écrit un guide sur la façon de demander à ChatGPT de fournir des sources et des citations. Heureusement, ChatGPT s’améliore dans la citation des sources, en particulier avec GPT-4o et la capacité de recherche sur le web dans la version à 20$ par mois.
Mais ChatGPT ne fournit pas toujours volontairement ces sources. Si vous faites des recherches, demandez toujours – toujours – vos sources.
Ensuite, testez les sources et assurez-vous qu’elles existent réellement. À plusieurs reprises, ChatGPT a cité des sources qui semblaient parfaitement correspondre à ce que je cherchais. Le seul problème, c’est qu’après avoir cliqué sur la source citée ou l’avoir recherchée par son titre, j’ai découvert que toute la source avait été fabriquée.
Vérifiez les source proposées par ChatGPT !
ChatGPT a même choisi de vraies revues universitaires, a inventé des noms d’auteurs et a ensuite attribué des titres convaincants aux articles. Imaginez à quel point la situation aurait été grave si j’avais inclus ces sources dans mon travail sans procéder à une double vérification.
Par conséquent, demandez les sources, vérifiez-les et mettez l’IA au pied du mur si elle vous donne une réponse inventée.
2. Dites à l’IA « montre ton travail »
Au début de mon exploration de ChatGPT, j’ai demandé à l’outil de m’aider à trouver un garage mécanique. Je l’ai envoyé sur Google pour analyser les commentaires. À l’époque, l’outil a pu accéder à ces sites et m’a fourni des informations utiles.
J’ai refait le test récemment et j’ai reçu une autre série de classements de mécaniciens. Il m’a dit : « Sur la base d’une analyse complète des commentaires Google concernant des ateliers de réparation automobile indépendants… »
Mais ChatGPT a menti.
L’exemple des faux avis Google
L’outil n’a jamais pris en compte les avis de Google. Ce résultat est probablement dû au fait que les sites (y compris ZDNET) sont devenus plus restrictifs lorsqu’il s’agit d’autoriser les IA à analyser leur contenu. L’IA aurait dû me dire qu’elle ne pouvait pas vérifier les avis de Google. Au lieu de cela, l’IA a prétendu qu’elle pouvait le faire.
Lorsque je lui ai demandé de montrer son travail, l’outil a de nouveau affirmé avoir consulté les avis de Google. Cependant, dans la réponse « montrez votre travail », l’outil a également affiché la source des avis qu’il avait analysés. Il s’est avéré qu’il s’agissait d’un site appelé Birdeye Reviews.
Je n’ai rien contre Birdeye Reviews. Je ne l’ai jamais utilisé. Mais là n’est pas la question. Ce qui compte, c’est que ChatGPT a déclaré avoir produit des informations basées sur les avis de Google.
L’expression « Montre ton travail » est un prompt puissant. Vous pouvez découvrir toutes sortes d’informations intéressantes sur le processus de raisonnement que l’IA a utilisé pour vous donner vos résultats.
3. Validation croisée des réponses d’une IA sur des questions connexes
Ce processus vous permet, à vous et à l’IA, d’explorer un sujet en profondeur pour voir si les réponses du chatbot restent cohérentes et contextuellement pertinentes. Nous utilisons beaucoup cette approche dans la recherche et l’ingénierie traditionnelles pour nous assurer que nous sommes sur la bonne voie. Elle peut également s’appliquer à l’IA.
Par exemple, imaginons que vous écriviez sur les pneus de voiture. Vous pourriez demander : « Quel matériau est utilisé dans les pneus de voiture ? » La réponse à laquelle on peut s’attendre est « le caoutchouc ». Mais le caoutchouc n’est pas une substance unique. Il y a le caoutchouc des arbres, le caoutchouc synthétique et les matériaux qui ont la souplesse et la résistance du caoutchouc. Mais qui n’en contiennent pas du tout.
L’exemple des différents types de caoutchouc
Par exemple, le caoutchouc et le TPU (polyuréthane thermoplastique) sont tous deux flexibles et ont la même sensation au toucher que le caoutchouc. Mais le caoutchouc synthétique est fabriqué à partir de monomères à base de pétrole et le TPU est fabriqué à partir d’un élastomère thermoplastique.
Vous pourriez demander à l’IA : « Quel type de caoutchouc est utilisé dans les pneus de voiture ? » ou « Le vrai caoutchouc est-il encore utilisé dans les pneus de voiture ? » Vous obtiendrez alors des réponses expliquant que les pneus de voiture sont fabriqués à partir d’un mélange de types de caoutchouc. Vous pourriez approfondir la question en demandant : « Où le caoutchouc est-il utilisé dans les voitures ? » ou « Quel type de caoutchouc est utilisé dans les pneus des voitures Lego ? ».
Le but de cette pratique n’est pas tant d’utiliser toutes les réponses dans votre document que d’explorer la manière dont l’IA traite cette catégorie de questions et de voir si elle perd complètement le fil.
En outre, comme ChatGPT conserve ses connaissances au cours d’une session, plus vous posez de questions et plus vous approfondissez un sujet spécifique, plus vous entraînez l’IA à rester dans le contexte de la sphère de connaissances que vous recherchez. Cette approche permet d’éviter que l’IA ne s’égare et augmente les chances d’obtenir des réponses précises.
4. Poser des questions sur des événements récents ou des informations sensibles au facteur temps
De nombreux chatbots ont des dates limites d’utilisation de la base de connaissances. La version gratuite de ChatGPT a une date limite de connaissance fixée à octobre 2023. Ce qui signifie que tout ce qui s’est passé dans le monde après cette date sera inconnu de l’IA.
ChatGPT Plus, dont la date limite de connaissance est également fixée à octobre 2023, peut également accéder à des informations sur le web. Cette capacité permet d’obtenir des informations beaucoup plus précises. La version gratuite de ChatGPT peut également accéder au web, mais de manière plus « limitée ».
En règle générale, OpenAI ne précise pas ce que signifie « limité » lorsqu’il parle de sa version gratuite. Cependant, vous pouvez généralement supposer que la limitation signifie moins de requêtes par session, moins de ressources fournies, et certaines fonctionnalités fonctionnant par intermittence.
L’exemple des pays de l’OTAN
Par exemple, lorsque j’ai demandé à la version gratuite de ChatGPT d’énumérer les pays membres de l’OTAN, elle m’a renvoyé une liste de 31 pays. En revanche, lorsque j’ai demandé à ChatGPT Plus de dresser la liste des pays membres de l’OTAN, j’ai obtenu une liste de 32 pays. Cela s’explique par le fait que la Suède a officiellement rejoint l’OTAN en mars 2024.
En règle générale, les chatbots vous indiqueront leur date limite si on le leur demande. Mais comme il existe des fonctionnalités supplémentaires (comme la recherche sur le web dans Plus), il est préférable d’essayer de poser des questions sur des événements que l’IA ne connaîtrait que si elle disposait d’informations actualisées.
Il y a une astuce à appliquer ici aussi.
Quelques minutes plus tard, j’ai demandé à la version gratuite de ChatGPT : « Peux-tu utiliser le Web pour trouver les membres actuels de l’OTAN ? ». Je lui ai demandé d' »utiliser le web ». J’ai obtenu la réponse la plus récente. Par conséquent, si vous utilisez la version gratuite, pensez à lui indiquer où chercher des informations pour obtenir une meilleure réponse.
Cette approche vous aidera à déterminer l’étendue des connaissances de l’IA et à déterminer si vous obtenez des détails relativement récents ou si vous devez tenir compte de connaissances manquantes en raison d’une date limite assez ancienne.
5. Posez des questions complémentaires et affinez votre requête de manière itérative
J’utilise cette approche lorsque j’utilise ChatGPT pour m’aider dans ma programmation. Je commence par une requête simple que j’affine et clarifie jusqu’à ce que j’obtienne un code de base. Une fois que cette approche fonctionne, j’ajoute une autre phrase ou des détails sur ce que je veux dans mon code. Après un certain nombre d’interactions qui ressemblent davantage à une conversation qu’à une session de codage, j’obtiens souvent un code vraiment utile.
Même si vous ne codez pas, vous pouvez utiliser cette approche. Imaginons que vous travailliez sur un projet lié aux cloud computing. Vous pourriez demander à l’IA : « Pouvez-vous expliquer les différents types de services de cloud computing ? »
Dans cet exemple, vous vous attendez à ce que les réponses portent sur des services tels que la messagerie électronique, l’hébergement web, la gestion de la relation client et d’autres catégories de logiciels en tant que service. Or, l’IA a répondu en décrivant le SaaS (software as a service), le PaaS (platform as a service) et l’IaaS (infrastructure as a service).
L’exemple des spécificités du Cloud computing
Vous savez que cette question peut être interprétée de différentes manières. Il faut donc poursuivre avec « Expliquez les différents types de services de cloud computing en vous concentrant uniquement sur ceux qui entrent dans la catégorie SaaS ».
Vous pourriez ensuite poser une question du type : « Sur la base de ces catégories SaaS, énumérez trois des services commerciaux les plus populaires dans chaque catégorie, ainsi que les forces et les faiblesses de chacun d’entre eux ».
Vous obtiendrez ainsi une description beaucoup plus détaillée, ainsi que les caractéristiques de chaque service. Mais affinons l’approche en procédant à une étape supplémentaire. L’IA de ce scénario a fourni des descriptions de chaque service, mais vous vouliez savoir en quoi les services diffèrent.
Vous pouvez affiner la requête en ajoutant le mot « comparatif », comme dans le prompt suivant : « Sur la base de ces catégories de SaaS, citez trois des services commerciaux les plus populaires dans chaque catégorie, ainsi que les forces et faiblesses COMPARATIVES de chacun d’entre eux. »
Dans mon test, ce dernier raffinement a donné lieu à des tableaux comparant les caractéristiques de chaque service. J’adore les tableaux. En fait, si l’IA ne renvoie pas l’information sous forme de tableau, mon conseil bonus est de demander à l’IA de présenter ses résultats sous forme de tableau. L’outil remanie souvent ses réponses de manière intéressante lorsqu’il fonctionne avec cette directive.