comment Wikipédia envisage d’utiliser l’IA

wikipédia


Wikipédia s’intéresse au potentiel de ChatGPT. Craignant que le chatbot ne produise de fausses informations, l’encyclopédie refuse encore de lui confier la rédaction d’articles. Par contre, l’IA pourrait venir assister les contributeurs en identifiant les contradictions présentes dans certaines pages…

Sous supervision, ChatGPT est capable d’écrire des textes variés, comme des mails ou des messages professionnels sur Slack, des articles de presse ou des livres entiers. De nombreux auteurs se servent d’ores et déjà de l’intelligence artificielle générative pour les assister dans l’écriture d’un roman. Poèmes, prose, rapports… rien ne fait peur au chatbot d’OpenAI.

Dans ces conditions, Wikipédia, la célèbre encyclopédie en ligne, s’intéresse de près au modèle linguistique. Interrogé par l’Evening Standard, Jimmy Wales, cofondateur de Wikipédia, reconnaît volontiers l’immense potentiel de ChatGPT.

« Dans les discussions au sein de la communauté Wikipédia que j’ai pu avoir jusqu’ici, les gens sont prudents – dans la mesure que nous sommes conscients que les modèles existants ne sont pas encore assez bons – mais aussi intrigués parce qu’il semble y avoir beaucoup de possibilités », déclare Jimmy Wales, estimant que « ChatGPT a saisi l’imagination du monde ».

ChatGPT, un gain de temps pour les contributeurs

C’est pourquoi le cofondateur de Wikipédia étudie la possibilité que ChatGPT participe à la correction d’articles destinés à l’encyclopédie. À ses yeux, le chatbot peut surtout s’avérer utile pour améliorer la logique de Wikipédia en repérant les contradictions dans les données. Il arrive en effet trop souvent que deux pages Wikipédia contiennent des informations contradictoires sur une même thématique :

« Je pense qu’il y a des opportunités intéressantes en matière d’assistance à l’humain, si vous aviez une IA qui a été formée sur le bon corpus de données – vous lui dites, par exemple, voici deux entrées de Wikipédia, vérifie-les et vois’il y a des déclarations qui se contredisent et identifie les endroits où un article semble dire quelque chose de légèrement différent ».

D’après l’entrepreneur américain, l’utilisation de ChatGPT pourrait faire gagner beaucoup de temps aux contributeurs de l’encyclopédie. Bien qu’un humain soit capable de repérer les contradictions, celui-ci devrait « lire les deux articles côte à côte et y réfléchir ». En automatisant le processus, la communauté Wikipédia pourrait économiser du temps, avance Jimmy Wales. Ce gain de temps se traduirait à terme par une hausse du nombre d’entrées, gonflant encore la base de données conséquente de l’encyclopédie.

Biais, IA et préjugés

Par contre, l’IA ne peut être utilisée pour éliminer les biais et les préjugés de l’encyclopédie, estime son cofondateur. D’après plusieurs organisations et experts, Wikipédia reproduit en effet tous les biais de la société actuelle. C’est l’une des principales critiques adressées à la plate-forme. Pour l’association des « sans pagEs », l’encyclopédie perpétue notamment les biais de genre, en creusant le fossé entre les hommes et les femmes.

Comme le souligne l’Evening Standard, la plupart des contributeurs de la plate-forme sont des hommes blancs. De facto, les articles Wikipédia rédigés par leurs soins mettent en avant leur propre perspective… au détriment de celle des minorités.

« La majorité des contributeurs sur Wikipédia sont des hommes. C’est déjà une réalité qui influence le contenu. Parce que, dans une société patriarcale, nous ne sommes pas socialisés de la même manière, les hommes et les femmes ont tendance à ne pas écrire sur les mêmes sujets », expliquait Natacha Rault, directrice de l’association des sans pagEs, à Madmoizelle l’an dernier.

Conscient des imperfections de l’encyclopédie, Jimmy Wales assure que l’IA est loin d’être une solution. Comme Wikipédia, les agents conversationnels ont aussi tendance à reproduire tous les préjugés de la société :

« Si vous formez une IA sur des données biaisées, elle va juste suivre ce biais, et beaucoup de gens dans le monde de l’IA se concentrent sur ce problème et ils en sont conscients », détaille l’entrepreneur.

Néanmoins, l’intelligence artificielle pourrait servir à identifier les thématiques instinctivement négligées par les contributeurs… ce qui ferait exploser le nombre de pages de la plate-forme collaborative. Cerise sur le gâteau, le coût de ChatGPT est négligeable, précise l’homme d’affaires :

« Utiliser l’IA pour tripler le nombre d’entrées sur Wikipédia n’augmenterait pas nos coûts de fonctionnement de plus de 1 000 £ (NDLR : 1138 euros) par an ».

À lire aussi : Fraude, terrorisme, propagande… ChatGPT inquiète la police européenne

Les risques d’hallucinations

De l’aveu de Wales, ChatGPT est encore loin d’être autonome. Sans une requête précise, complète et bien structurée, il est impossible que l’intelligence artificielle produise un texte de qualité. À ce stade, l’IA a encore besoin d’un humain pour la guider dans la rédaction :

« Je pense que nous sommes encore loin de : “ChatGPT, s’il vous plaît écrivez une entrée Wikipédia sur la construction de l’État impérial”, mais je ne sais pas à quelle distance nous en sommes, certainement plus près que je ne l’aurais pensé il y a deux ans ».

De plus, le chatbot a souvent tendance à « halluciner ». Quand l’IA ne trouve pas la réponse à certaines questions, elle génère parfois des informations erronées pour combler les vides. Il arrive ainsi que les textes produits avec ChatGPT soient criblés d’inexactitudes ou d’absurdités. C’est aussi le cas de GPT-4, la dernière mise à jour du modèle de langage, que nous avons testé. Jimmy Whales en est conscient :

« Il a tendance à inventer des choses à partir de rien, ce qui est vraiment mauvais pour Wikipédia – ce n’est tout simplement pas correct. Nous devons être très prudents à ce sujet ».

À ce stade, Wikipédia ne prévoit donc pas de laisser ChatGPT se charger de la rédaction de pages à la place de ses contributeurs. La donne finira-t-elle par changer au fur et à mesure que le modèle GPT évolue ?

Source :

Evening Standard



Source link

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.