Les données de confiance, talon d’Achille de l’intelligence artificielle

Les données de confiance, talon d’Achille de l’intelligence artificielle


Depuis quelques années maintenant, l’écosystème du monde numérique, aussi bien académique qu’industriel, explore l’intelligence artificielle (IA) dite « de confiance » : nous sommes aux portes d’une régulation concernant les risques technologiques du déploiement de l’IA qui met en avant principalement l’explicabilité, la robustesse et la transparence des algorithmes. Il s’agit de l’Artificial Intelligence Act (AI Act), publié par la Commission européenne en avril 2021, qui prévoit des niveaux de risques gradués selon l’impact sur les humains.

Les procédures d’évaluation de conformité aux principes de l’IA de confiance, mentionnées dans ce projet de loi et qui concentrent les efforts industriels et de standardisation, concernent l’évaluation et l’observabilité des déploiements algorithmiques. Mais dans toute décision algorithmique, les données sont le carburant qui alimente le moteur que sont les algorithmes. C’est la raison pour laquelle on ne peut dissocier une évaluation des comportements des algorithmes de l’analyse de l’état des données, dans un but d’efficacité opérationnelle de l’évaluation de la conformité aux valeurs définissant une IA digne de confiance.

La question-clé est la suivante : peut-on faire de l’IA de confiance sans des données de confiance ? En raison de la dualité des données et des algorithmes, par essence les deux faces de la même pièce, la réponse est évidemment non. Pour autant, cette notion n’a pas reçu l’attention qu’elle mérite au regard de son impact sur la globalité d’un processus de décision algorithmique.

Comment peut-on s’assurer de la confiance dans les données ? Cette notion va au-delà des aspects habituels de qualité et d’intégrité des données. On peut, par exemple, considérer le critère d’éligibilité des données qui se distingue de leur qualité. Quand bien même les données sont de haute qualité, l’inclusion d’un sous-ensemble peut ne pas être appropriée pour résoudre un problème particulier et, de fait, constitue une source de bruit et de biais par rapport au problème cible.

Données transformées

De plus, les données dans les entreprises sont de diverses qualités et proviennent de différentes sources internes et externes, en particulier avec l’existence des data brokers, qui font la collecte depuis une multitude de sources, dont les réseaux sociaux. De fait, les données utilisées dans un processus de décision sont des données composées et transformées.

Il est essentiel de maîtriser le niveau de confiance sur l’ensemble du cycle de vie de la donnée transverse au sein d’une entreprise, et pas seulement dans certains segments d’affaires particuliers. Les fondements structurels des données doivent être assurés indépendamment de leur finalité d’usage pour permettre leur réutilisation transverse. Concrètement, par exemple, en rendant cohérents des modèles de gestion des données de référence dans une grande enseigne commerciale. Par la suite, le choix des modèles de données adoptés doit être piloté en fonction de la finalité « business » recherchée, par exemple les différentes facettes des données consommateurs.

Il vous reste 17.33% de cet article à lire. La suite est réservée aux abonnés.



Source link

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.