Eviter les biais de données : pourquoi l’éthique a besoin d’un champion

Eviter les biais de données : pourquoi l'éthique a besoin d'un champion


Dans le monde incertain d’aujourd’hui, les processus décisionnels fondés sur les données sont le moteur de la survie de nombreuses entreprises. La prise de décision basée sur les données produit des résultats plus bénéfiques que le seul sentiment instinctif, mais de nombreuses entreprises ont encore du mal avec cette réalité. Cela paraît d’autant plus surréaliste et hors de portée lorsque l’on constate le simple volume – toujours croissant – de données générées quotidiennement dans le monde.

Si les données sont le carburant nécessaire à l’obtention de ces informations commerciales, l’intelligence artificielle (IA) est le moteur qui alimente ce processus, offrant de nouvelles solutions et informations auparavant hors de portée. Chaque organisation devenant une sorte d’usine de données, l’automatisation est désormais le seul moyen de transformer rapidement les milliards de lignes et les milliers de colonnes de données en informations. Les progrès de l’IA contribuent à fournir la vision autonome et la génération de prédictions avancées nécessaires pour guider rapidement la prise de décision basée sur les données.

Néanmoins, tous les projets d’IA ne sont pas égaux, et les résultats de tout système d’IA peuvent accélérer, impacter, ou encore gravement ralentir les efforts visant à instaurer la confiance dans l’IA.

Se former à l’éthique

Les modèles d’IA sont généralement formés sur des données historiques. Si ces données contiennent des biais, le modèle peut les propager dans les décisions futures. Par exemple, si une entreprise a historiquement embauché plus d’hommes que de femmes pour des rôles liés à la technologie et qu’elle introduit des données historiques de CV dans une IA conçue pour examiner les candidatures, le modèle résultant peut être biaisé à l’encontre des femmes qui postulent.

Et malheureusement, cette situation hypothétique a déjà eu lieu. Amazon a dû mettre un terme à son propre algorithme de recrutement par IA, car le modèle favorisait les candidats qui se décrivaient à l’aide de mots que l’on trouve plus souvent sur les CV des candidats masculins, ce qui entraînait un biais regrettable à l’encontre des candidatures féminines. La formation et le test des données font partie intégrante du succès.

Bien que l’IA puisse analyser rapidement de grands volumes de sources de données disparates pour permettre aux experts du domaine de prendre des décisions, elle ne peut remplacer le jugement humain. Les préjugés systémiques peuvent se glisser dans l’IA, car les données historiques peuvent ne pas être totalement représentatives, et les groupes minoritaires peuvent ne pas être du tout présents dans ces ressources de données.

La valeur de l’éthique des données

La réussite des systèmes d’IA dépend essentiellement de la qualité des données de formation, de la transparence des processus de gouvernance internes et des niveaux de compétence des humains impliqués dans sa création. Les projets d’IA doivent être en mesure d’évaluer, d’authentifier et d’actualiser les données historiques pour simuler des résultats capables de s’adapter dynamiquement à des exigences commerciales en constante évolution.

Toutes les données sont souvent accompagnées d’une certaine forme de partialité, que ce soit intentionnellement ou non. L’âge, la race, le sexe, les antécédents médicaux, la situation financière, les revenus, la localisation et bien d’autres facteurs peuvent produire des biais. Les ensembles de données de formation utilisés pour les systèmes d’IA doivent être exempts de discrimination pour garantir le résultat souhaité.

Avec la bonne approche, l’IA éthique est à la portée de toutes les organisations. La data science et l’IA jouent un rôle puissant pour obtenir un avantage et devancer la concurrence, mais l’IA éthique offre des avantages à long terme et un niveau fondamental de précision de la compréhension qui, sous réserve d’un leadership et d’une stratégie appropriés, sera rentable à court et à long terme.

Regarder vers l’avenir : le Chief Ethics Officer

Les stratégies doivent reposer sur des bases solides lorsqu’on cherche à concevoir et à déployer de manière responsable des projets d’IA réussis. A l’instar d’une maison qui nécessite un architecte qualifié pour planifier, concevoir et superviser sa construction, le déploiement responsable de l’IA et de l’analytique requiert un professionnel formé à la data science.

Une étude commandée par Alteryx sur l’état des connaissances en matière de données a révélé que 42 % des employés travailleurs de la donnée considéraient l’éthique des données comme « non pertinente » pour leur rôle – ce qui jette une ombre sur les futurs projets basés sur l’IA. La prévalence des décisions quotidiennes augmentant au fil du temps, le besoin urgent de leadership en matière d’éthique de l’IA et de mise en place d’une culture des données éthique devient de plus en plus évident. Il est crucial que toute stratégie d’éthique de l’IA intègre une connexion humaine et une culture des données qui réduise les risques de partialité. Pour réussir, cependant, un leadership et une stratégie appropriés sont essentiels. C’est là qu’intervient le Chief Ethics Officer.

La maîtrise des données et l’éthique vont de pair lorsqu’il s’agit de développer et de déployer une IA digne de confiance, capable d’augmenter et de compléter les capacités humaines. En intégrant des pratiques transparentes d’éthique des données dans les activités quotidiennes de l’ensemble de l’organisation, un responsable de l’éthique fournit un niveau de surveillance centrale et de gouvernance structurée nécessaire pour atténuer les risques en garantissant qu’il n’y a pas d’utilisation abusive des données.

Pourquoi l’éthique des données dépend de la montée en compétences de tous

Comment sauvegarder les modèles et atténuer les inquiétudes liées aux préjugés ? Par la démocratisation des données et de l’analyse. En veillant à ce qu’un large éventail d’experts du domaine soit formé à la maîtrise des données, les entreprises peuvent s’assurer qu’un plus grand nombre de points de vue, d’expériences et d’expertises soient directement capables de relever un défi.

Les organisations ont besoin d’un chef de file, mais il est tout aussi important d’intégrer des groupes diversifiés dans le processus afin qu’ils puissent apporter un éclairage supplémentaire à la collecte et à l’analyse des données. Les équipes diversifiées peuvent apporter un éclairage unique sur les ensembles de données et utiliser leur propre expérience du domaine pour évaluer les biais et la validité avant que les données n’atteignent le stade de la production.

Bien que le Chief Ethics Officer assume la responsabilité d’être le fer de lance des meilleures pratiques en matière d’utilisation éthique des données, cela nécessite une approche au sein de l’entreprise reposant sur une base solide de points de vue multiples et diversifiés. Les entreprises collectent de grandes quantités de données provenant de sources multiples, et l’intelligence humaine est essentielle pour faire le point sur la façon dont les données sont utilisées pour entraîner les algorithmes de machine learning dans tout système d’IA. En tissant un tissu de compétences en matière de données dans l’ensemble de l’organisation, les employés découvriront non seulement de nouveaux problèmes, verront de nouvelles perspectives et porteront leur prise de décision à de nouveaux sommets, mais ils contribueront également à éviter les pièges et les problèmes éthiques liés au déploiement de l’IA. La démocratisation des données est la clé d’un changement positif, et la culture des données est à la base de ce processus.

L’avenir de l’IA éthique est à notre porte. Avec un responsable de l’éthique chargé de veiller à ce que les humains et l’éthique soient au centre de l’innovation en matière d’IA – le cartographe numérique de l’organisation – les experts en la matière qui connaissent les données peuvent construire des modèles de machine learning et découvrir des incohérences dans les données qui pourraient autrement passer inaperçues pour les data scientists n’ayant pas de connaissance directe du domaine.





Source link

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.