Le 20 juin dernier, l’Assurance Maladie a déployé une plateforme gratuite et accessible à tous pour visualiser les données de dépenses de santé des Français.
Diabète, cancer du poumon ou encore maladie de Parkinson, Data pathologies se concentre sur une cinquantaine de pathologies dans sa forme actuelle, sur la base des 1,5 milliard de factures qui entrent dans le système chaque année sur le territoire national.
Toutes les donnée traitées sont restituées sous la forme d’infographies interactives. Exit les tableaux Excel difficiles à lire : l’ambition de Data pathologies est de toucher un large public, comme les acteurs du systèmes de santé, les journalistes ainsi que les associations de patients et assurés.
Les chercheurs ne font pas partie du coeur de cible, précise Damien Vergé, directeur de la stratégie, des études et des statistiques (DSES) à la CNAM, à ZDNet. Mais ils peuvent tout de même s’y référer, en vertu du principe même de l’open data. Le département que Damien Vergé dirige oeuvre notamment pour le partage des
données de santé à des fins de recherche en même temps qu’il se concentre sur les enjeux de l’open data,
dont Data pathologies est « le dernier fleuron » à date.
Données agrégées et intraçables
Les données intégrées à Data pathologies proviennent de la cartographie
médicalisée des dépenses et des pathologies que l’Assurance Maladie met à
jour tous les ans depuis 2015. Ce travail d’analyse s’appuie lui-même
sur les données issues du système national des données de santé (SNDS).
Un certain nombre de paramètres peuvent être affinés sur Data
pathologies pour faire apparaître des résultats par région ou encore par
tranche d’âge.
Les données rassemblées sur la plateforme sont intraçables, assure Damien Vergé. « Tout part des données de facturation. Toutes les informations reçues
sont d’abord pseudonymisées et le numéro de sécurité sociale est
chiffré trois fois de manière irréversible. Ce sont les données agrégées qui sont restituées. Ainsi, aucune
identification n’est possible à partir de ces données agrégées. Sous une
dizaine d’individus, les données n’apparaissent pas. »
« Valoriser autrement notre patrimoine en open data »
Les dernières données actualisées dans Data pathologies remontent à 2020. Ce décalage s’explique par le temps nécessaire pour classer, croiser et analyser le volume gigantesque de données produites chaque année.
Des analyses à l’aide d’algorithmes sont menées pour classer les pathologies et les dépenses liées à ces pathologies. Les algorithmes utilisés sont documentés dans la page de méthodologie de Data pathologies. « Nous sommes dans une démarche d’améliorations permanentes. Tous les
ans, nous réévaluons ces algorithmes » souligne le responsable.
La démarche open data de l’Assurance Maladie n’est pas nouvelle. « Beaucoup de données sont déjà disponibles depuis l’espace Etudes et Données d’ameli.fr. On y trouve énormément d’informations sur les dépenses et les pathologies. Mais ces données sont partagées sous forme de tableaux Excel, ce qui n’est pas du tout commende pour un public non expert » note Damien Vergé.
L’Assurance Maladie a réalisé une première expérience de datavisualisation autour des données de santé pour suivre la vaccination contre le Covid-19, Data vaccin Covid. « Cette expérience nous a donné envie de valoriser autrement notre patrimoine en open data » dit Damien Vergé. « Il y a une vraie différence entre mettre des données sous forme de
PDF figé et réaliser une présentation interactive. La réception n’est
pas la même ».
Des évolutions au fil des retours d’expérience
Six mois ont été nécessaires pour bâtir Data pathologies. L’Assurance Maladie a travaillé avec Opendatasoft, une entreprise française qui propose un logiciel de partage de données, pour assurer le développement de son outil. L’agence de datavisualisation WeDoData a également été mise à contribution dans ce chantier pour « affiner le web design du site » précise Damien Vergé.
Le projet a mobilisé une dizaine de personnes du côté de la Cnam. L’Assurance Maladie a réalisé un certain nombre de démonstrations aux agences régionales de santé pour qu’elles s’approprient la plateforme.
Si les premiers retours sont « extrêmement positifs » pour l’heure, commente le directeur, il est encore tôt pour juger de la portée de la plateforme. Des évolutions de la plateformes ne sont pas à exclure pour améliorer l’outil, évoque le directeur.
(function(d, s, id) { var js, fjs = d.getElementsByTagName(s)[0]; if (d.getElementById(id)) return; js = d.createElement(s); js.id = id; js.src = "//connect.facebook.net/fr_FR/all.js#appId=243265768935&xfbml=1"; fjs.parentNode.insertBefore(js, fjs); }(document, 'script', 'facebook-jssdk'));