La post-vérité passée au crible du big data

La post-vérité passée au crible du big data


« Post-vérité : nom féminin. Concept selon lequel nous serions entrés dans une période appelée ère de la post-vérité où l’opinion personnelle, l’idéologie, l’émotion l’emportent sur la réalité des faits. » Depuis que « post-vérité » a fait son entrée dans les dictionnaires – 2016 pour l’anglophone Oxford, 2018 et 2019 respectivement pour Le Robert et le Larousse dont la définition est donnée ci-dessus –, les débats scientifiques se multiplient. Comment se positionner face à ce phénomène sociétal flou et non précisément daté, que l’on associe tout autant à l’émergence des réseaux sociaux, l’élection de Donald Trump ou encore au vote du Brexit ?

En France, le Comité national d’éthique du CNRS s’est autosaisi et a publié un avis le 12 avril 2018 : « Quelles nouvelles responsabilités pour les chercheurs à l’heure des débats sur la post-vérité ? » A l’occasion de ses 30 ans, l’Institut universitaire de France s’est interrogé, en octobre 2021 : « Post-vérité ? La question de la crédibilité de la recherche scientifique à l’heure des faits alternatifs », etc. Et si la science des algorithmes et des données massives pouvait apporter sa pierre au débat ?

C’est le parti pris d’une équipe de scientifiques multidisciplinaires des universités néerlandaise et américaine de Wageningen et de l’Indiana. Pour matière première, cette équipe a utilisé des millions de livres en anglais et en espagnol couvrant la période de 1850 à 2019, numérisés et rendus accessibles par l’application linguistique de Google Ngram Viewer. « La montée en puissance de l’argumentation politique post-vérité, qui a pris la société par surprise, suggère que nous vivons une période historique particulière concernant l’équilibre entre émotion et raisonnement, expliquent en introduction les auteurs de l’étude (PNAS, décembre 2021) . Pour explorer si c’est effectivement le cas, nous avons analysé le langage dans des millions de livres, romans ou essais. » En partant des cinq mille mots les plus utilisés dans chacune des deux langues, leur approche a été celle de l’analyse en composantes principales (ACP), qui permet statistiquement de tirer des tendances.

Périodes linguistiques distinctes

Les résultats de cette recherche permettent de dessiner, courbes à l’appui, deux périodes linguistiques distinctes : entre 1850 et 1980 environ, la fréquence d’utilisation de mots associés à la rationalité, tels « déterminer », « conclusion », « analyse », etc., a systématiquement augmenté tandis que celle de mots à connotation sentimentale ou liés à l’expérience humaine, tels « ressentir », « croire », « imaginer », etc., baissait. Ce schéma s’est inversé dans les années 1980, puis même accéléré en 2007 lorsque la fréquence des mots liés aux faits a chuté tandis que le langage chargé d’émotion a crû.

Il vous reste 62.07% de cet article à lire. La suite est réservée aux abonnés.



Source link

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.