Accueil / Numérique / Big Data / Open Data en santé : la France à la traîne ?

Open Data en santé : la France à la traîne ?

Phénomène global et assez récent, l'Open Data constitue aujourd'hui une tendance forte qui milite pour le partage public des données. D'abord porté par des mouvements associatifs, l'Open Data, littéralement, "données ouvertes", doit permettre un accès libre et gratuit aux données. Ainsi, cette appropriation collective et associative de l’Open Data contribue à un enrichissement du débat citoyen et démocratique en proposant une autre dimension du service public. Transparence et confiance sont au cœur de la dynamique de l’Open Data. La France est-elle encore une fois à la traîne ?

On pourrait le penser quand on lit le dernier atlas de la Drees sur l'état de santé des régions. Sa lecture nous laisse quelque peu sur la faim : quelques indicateurs régionaux sans grande profondeur y sont compilés. La cerise sur le gâteau est que le document est verrouillé : aucun copier/coller des données n'est possible. On se contentera d'une copie d'écran de mauvaise qualité...

C'est pourtant à la Drees, en la personne de son fringuant directeur, Franck von Lennep, touche-à-tout brillant et anti-conformiste, que Marisol Touraine a demandé de porter le débat sur l’open data en santé lancé le 21 novembre 2013. Avec Philippe Burnel, ancien DG de la FHP, passé par la HAS et la DGOS, actuel délégué à la stratégie des systèmes d’information de santé au Ministère des affaires sociales et de la santé, ils ont pour mission "d’animer une Commission Open Data et de réunir l’ensemble des parties prenantes, notamment les producteurs de données de santé, des représentants des patients et des usagers, des chercheurs et universitaires, des professionnels de santé, des représentants d’établissements de santé, et des industriels."

Retour sur le développement de l'Open Data en santé

Bien avant l'apparition de l'Internet, c'est en 1942 que Robert King Merton a le premier enjoint la communauté scientifique de publier de manière ouverte les résultats de la recherche afin de céder les droits de propriété intellectuelle et ainsi accélérer le processus d'investigation et de recherche. Avec l'essor du Big Data et des nouvelles technologies de l'information, le phénomène de libéralisation et de partage des données prend de l'ampleur. C'est le Prix Nobel d'Économie en 2009, Elinor Orstrom, qui plaide pour rendre public et gratuit les gigantesques bases de données que la communauté est capable de brasser. En décembre 2007, un congrès près de San Francisco, rassemblant quelques précurseurs du Web (dont notamment Tim O'Reilly, l'inventeur du Web 2.0, ou Lawrence Lessig, créateur de la licence Creative Commons), a contribué à conceptualiser davantage la problématique de l'Open Data. À tel point qu'en 2008, Barack Obama décide de favoriser une politique de libéralisation des données, contribuant à populariser l'Open Data dans la sphère politique.

Lire : santé et vie privée, mariage impossible ?

En France, différentes villes depuis 2010 se sont emparées du phénomène de l’Open Data : parmi les pionnières, Paris ou Rennes rendent certaines données et cartes publiques. Au-delà même de partager des données, l'idée est d'améliorer le service public en impliquant les usagers de services web et mobiles à l’usage des citoyens.

Depuis le lancement de la plateforme publique data.gouv, le 5 décembre 2011, d'autres villes et collectivités locales se sont emparées du sujet :  Montpellier, Strasbourg, Lyon, Nancy, Aix-en-Provence, Toulouse, Bordeaux, La Rochelle, Nantes, Angers, Versailles ou encore Issy-les-Moulineaux ont lancé entre 2012 et aujourd’hui des plateformes web dites « Open data ». Mais ces initiatives restent timides et prudentes au regard des applications développées et de la profondeur des données disponibles.

Dans le domaine de la santé, un rapport de la Commission Open Data en Santé remis à Marisol Touraine en juillet dernier dresse un panorama en France. Comme le rappelle le rapport, "les données de santé sont mentionnées, dans la loi  "Informatique et Libertés", comme des données sensibles, appelant une vigilance particulière" (p.11). Quelle utilisation dans l'Open Data sans porter atteinte aux droits des usagers ?

L'Open Data ou la libéralisation des données

Peu de dispositions encadrent finalement le partage public des données de santé. C'est la loi du 6 janvier 1978, modifiée en 2004, qui a transposé la directive européenne 95/46/CE, principale directive européenne en la matière. Deux chapitres de cette loi traitent des données de santé : les chapitres 9 et 10. Le traitement de données nominatives "ayant pour fin la recherche dans le domaine de la santé", encadré par la loi du 1er juillet 1994, est possible après autorisation de la Cnil (p.17). L'autre chapitre a été rajouté lors de la création de la CMU en juillet 1999 et la mise en place du programme de médicalisation des systèmes d’information des hôpitaux (PMSI) et autorise le traitement de données de santé que si celles-ci sont agrégées ou anonymisées. Ainsi, "toutes les dispositions propres aux données de santé soulèvent la question de leur champ d’application et donc de la définition de cette notion. Tant la directive 95/46/CE que la loi du 6 janvier 1978 sont muettes à ce sujet. On ne dispose à ce jour que d’éclairages partiels donnés par les travaux préparatoires de la loi, par la jurisprudence ou par la doctrine des autorités administratives indépendantes chargées de la protection des données" (p.17).

D'un autre côté, c'est la loi dite CADA du 17 juillet 1978, le pendant de la loi Informatique et Liberté, qui fonde le principe de l'Open Data en France. En son article premier, elle reconnaît à toute personne le droit d’obtenir les documents administratifs détenus par une administration ou une personne de droit privé dans le cadre d’une mission de service public, "quels que soient leur date, leur lieu de conservation, leur forme et leur support, les documents produits ou reçus, dans le cadre de leur mission de service public, par l’Etat, les collectivités territoriales ainsi que par les autres personnes de droit public ou les personnes de droit privé chargées d’une telle mission. Constituent de tels documents notamment les dossiers, rapports, études, comptes rendus, procès-verbaux, statistiques, directives, instructions, circulaires, notes et réponses ministérielles, correspondances, avis, prévisions et décisions."

Ainsi, c'est l’article 13 de la loi CADA qui rend possible la réutilisation des données publiques comportant des données à caractère personnel, soit "parce que les personnes intéressées y ont apporté leur consentement préalable, soit parce que les données à caractère personnel dans les données publiques ont fait l’objet d’une anonymisation, ou à défaut si une disposition légale ou réglementaire le permet. En tout état de cause, cet article 13 précise que la réutilisation des données publiques comportant des données à caractère personnel demeure soumise aux prescriptions de la loi "Informatique et Libertés" du 6 janvier 1978 modifiée". (p.21).

De fait, en France, la mission Etalab, créée en 2011, placée sous l'autorité du Premier ministre et dirigée par Henri Verdier, a permis de dresser une cartographie détaillée des données de santé à partir d’une revue des principaux rapports existants sur les données de santé en France et de recherches menées à partir des sites Internet des principaux gestionnaires de données, complétées lors d’entretiens avec une trentaine d’organisations gestionnaires de données de santé. Cette cartographie des données de santé ainsi produite identifie plus de 240 jeux et bases de données (p.32) disponibles depuis le 2 avril 2014 sur le site www.data.gouv.fr.

Ce panorama dressé par la mission montre le caractère récent des démarches d’open data en santé, même dans les pays disposant d’une avance sur la France. "Si le principe d’une plus grande ouverture des données de santé ne semble plus faire débat, la démarche d’ouverture – quelles solutions légales, réglementaires, or organisationnelles ; quelles catégories de données ouvrir et avec quelle granularité – reste matière à expérimentation. Le cas récent du programme « Care.data » au Royaume-Uni, même s’il ne concerne pas directement l’open data30, illustre en particulier la difficulté de bien clarifier la frontière entre open data et partage des données personnelles ou réidentifiantes à des fins de recherche, commerciale ou non commerciale" (p.34). Ainsi, le rapport de la Commission souligne plus loin que "la cartographie des données montre que la France dispose d’une exceptionnelle richesse d’informations médico-administratives, actuellement inaccessibles aux citoyens à quelques exceptions près – principalement des tableaux fortement agrégés mis à disposition par l’Assurance Maladie et l’ATIH." Par contre, concernant la qualité et la sécurité des soins, la France dispose de données "nettement moins complètes, et surtout moins ouvertes, que les pays anglo-saxons " (p.48)

L’intérêt de l’Open Data repose sur l’ouverture des données. Comme le note le rapport, c’est une ouverture vers l’inconnu, difficile à envisager concrètement, car "la limite de l’exercice est que la demande est potentiellement infinie, alors que la production de statistiques agrégées est coûteuse et répond souvent mal ou trop lentement aux besoins particuliers des uns et des autres, notamment aux besoins des chercheurs ou à des questions d’une grande technicité ou exigeant le recours à plusieurs sources de données." (p.51).

La transition  numérique, nouvelle révolution industrielle ?

Face à l'essor des technologies et d'Internet, tous les dix ans, la puissance des ordinateurs est multipliée par trente, et leur coût est divisé de même. Les citoyens peuvent ainsi se connecter partout, se synchroniser, échanger, coopérer. La puissance de la multitude joue un rôle que les pouvoirs publics ne doivent pas négliger. Et les possibilités d'évolution de traitement de ces champs de données sont infinies. "L’informatisation des processus de gestion et (de plus en plus) de soins génère un volume croissant de données numériques. Leur regroupement dans de vastes bases de données structurées ou de simples entrepôts de données permet de disposer d’une « matière première » dont l’intérêt dépasse largement les finalités initiales qui ont conduit à leur constitution. (…)il est facile d’imaginer (le NHS en donne l’illustration avec la General Practice Research database) que les données de soins anonymisées et regroupées dans des bases de données pourront être également une source majeure de progrès des connaissances et de création de valeur.(…) Au-delà, on peut ainsi facilement imaginer le potentiel de connaissance que représenterait une base consolidée et anonymisée de dossier médical partagé (DMP) dont les données seraient structurées voire codées." (p.37).

Ainsi, il existe un double enjeu à la fois global et individuel. L'ouverture des données permet aux citoyens de "peser davantage sur les orientations du système de santé, en fondant leurs contributions sur une connaissance renforcée de son fonctionnement". Cet accès aux données renforce la démocratie sanitaire et permet de moduler la décision publique. Par exemple, les données de santé peuvent tout à fait servir à "documenter des inégalités territoriales de santé ou d’offres de services aussi bien que les pratiques de dépassement d’honoraires". (p.37).

Lire : Démocratie sanitaire : trompe-l’œil, coup d’État ou usine à gaz ?

 

Toujours dans une dimension citoyenne, la mise à disposition d’informations à destination des "patients citoyens" passera par l’émergence de "nouveaux services d’information sur l’offre et les parcours de soins" afin de "réduire l’asymétrie d’information entre patients et professionnels de santé, offrant la possibilité d’une forme de concurrence par la qualité constitutive d’une dynamique d’amélioration continue de la qualité du système de santé". L'information ainsi générée se doit d'être accessible à tous, c'est-à-dire que son contenu doit être reproductible et démultiplié sur d'autres supports.

Mais, le véritable enjeu de ces méta-données publiques reste l'innovation et la recherche. On sait que la recherche est grandement productrice et utilisatrice de données populationnelles. "Avec les progrès rapides des méthodes de séquençage et d’autres instruments d’analyse biologique, ces perspectives s’étendent à la recherche biomédicale dans son ensemble (comme le confirment des expériences étrangères, notamment au Danemark). Le couplage entre les données de recherche biomédicale et les bases médico-administratives, voire avec d’autres sources de données statistiques populationnelles, constitue un élément stratégique clé de la compétitivité internationale à moyen terme de la recherche française." (p.41). Mais le chaînage entre les bases est absent par crainte d'identifier les patients. Pourtant, le rapport défend cette prise de risque pour le bien de la santé publique et l'innovation en santé : "La communauté des chercheurs est particulièrement intéressée par la possibilité d'avoir accès à des données porteuses de risque de ré-identification dans la mesure où, par définition, ces données individuelles permettent d'effectuer les traitements statistiques les plus précis et les plus puissants. Il ressort des travaux menés sur l’analyse du risque de réidentification qu’au-delà des données clairement anonymes, il existe une zone grise pour laquelle il est d’autant moins possible de se prononcer sur l’absence de risque de réidentification que l’on ne connaît pas, par exemple, les autres données disponibles entre les mains des tiers. Le constat de cette situation ne doit pas conduire à fermer l’accès aux données, mais à en organiser l’accès de telle sorte que les risques soient évalués et mis en regard des bénéfices attendus." (p.53) Les chercheurs militent pour disposer de données descriptives des patients (revenu, catégorie socioprofessionnelle, diplôme, niveau d’instruction, etc.) accessibles, soit directement dans le SNIIRAM, soit par appariement avec des bases de données sociales ou fiscales, des variables socio-économiques.

Lire : santé et vie privée, mariage impossible ?

La perspective d'utiliser plus largement des données médico-administratives dans un objectif de production de connaissances utiles à la santé publique s’est amplifiée récemment. Elle provient essentiellement de l'amélioration, de la centralisation et du chaînage des systèmes d'informations de l'assurance maladie (SNIIRAM) et de l'administration hospitalière (PMSI). La fiabilisation de ces données et leur ouverture progressive aux chercheurs ont généré de très nombreuses perspectives de recherches, dont les retombées pour la santé publique sont importantes. La communauté des chercheurs en santé y a ainsi identifié des opportunités évidentes de gain de compétitivité en matière de production scientifique.

Mais jusqu'où aller ? La Commission est claire : "Pour les données strictement anonymes, c’est-à-dire, à risque nul d’identification, l’accès doit être totalement libre, sans restriction de réutilisation des données publiques. (…)Pour les données présentant un très faible risque de ré-identification du fait de la granularité limitée des informations mises à disposition ou de la non exhaustivité de la population décrite (échantillon), une procédure simplifiée pourrait être retenue dès lors que la Cnil, après avis d’un comité technique, en aura validé les caractéristiques. (…)pour les données détaillées, emportant de ce fait un risque plus important de réidentification, il est proposé de simplifier le circuit des demandes d’accès des organismes privés ou publics en créant un canal unique d’autorisation délivrée par la Cnil." (p.62)

Le rapport Bras de septembre 2013 sur la gouvernance et l'utilisation des données de santé note la difficulté générale néanmoins d'accéder au système d'informatisation. "Les règles actuelles d’accès au SNIIRAM sont touffues et contestées. Au regard des données personnelles de santé, certaines dispositions peuvent paraître peu protectrices, d’autres au contraire paraissent élever des obstacles excessifs aux besoins de la recherche ou de l’information du public, d’autres enfin semblent relever surtout d’une logique de réciprocité entre les organismes concernés ou de méfiance à l’égard du mauvais usage qui pourrait être fait des données. Le tout est régi par des dispositions spécifiques et par divers articles de la loi Informatique et Libertés (LIL), laquelle opère une distinction curieuse entre les « traitements de données de santé à caractère personnel ayant pour fin la recherche dans le domaine de la santé » (chapitre IX de la LIL) et les « traitements des données de santé à caractère personnel à des fins d’évaluation des pratiques ou des activités de soins et de prévention » qui font l’objet du chapitre X, lequel vise plus spécifiquement les accès au SNIIRAM et au PMSI, comme si ces bases, initialement destinées à l’évaluation qualitative et quantitative des activités de soins, ne pouvaient pas servir aussi à des travaux statistiques d’études et de recherche plus larges. Dans cet ensemble de dispositions, il convient de distinguer la procédure par laquelle certains organismes obtiennent des droits d’accès permanents à certaines catégories de données du SNIIRAM et les procédures donnant à certains organismes un droit d’accès ponctuel à certaines données du SI, qui s’appuient sur des dispositifs juridiques variés dont la caractéristique commune est que l’accès aux données doit être in fine autorisé par la CNIL. A côté de ces règles d’accès aux données personnelles du SI, il n’est rien prévu de spécial pour favoriser la mise à disposition, que ce soit à titre gratuit ou onéreux, des données anonymes." (p.31)

Le rapport Bras pose également la question de savoir qui gèrera ces bases : la CNAMTS ou la DREES (p.74) ? "Dès lors que le SI est géré par la CNAMTS, une des parties prenantes du système de santé, on ne peut dissiper le soupçon qu’elle gère un bien commun en fonction de sa perspective propre." Mais d'un autre côté, pour la DRESS, gérer ces énormes données suppose de les faire migrer et vivre, "fonctions nouvelles et ambitieuses que la DREES ne peut pas assurer à moyens constants". L'une ou l'autre, l'essor de l'Open Data les place dans des fonctions au-delà de leurs compétences habituelles. Pour l'instant, l’accès aux données de santé de l’assurance maladie est organisé selon trois modes conditionnés par un encadrement juridique spécifique : des statistiques et des services accessibles à tous, des tableaux de bord de données partagées au sein de l’Institut des données de santé, créé en 2004,  et des données accessibles par les organismes publics sur autorisation de la Cnil, depuis le portail sécurisé du SNIIRAM.

Quel avenir ?

La Commission recommande "d’élargir le champ des données du répertoire partagé des professionnels de santé (RPPS) disponibles en open data (exemples : inclure les adresses des cabinets médicaux, les diplômes, un indicateur du nombre d’années de pratique), d’ouvrir les Répertoires Opérationnels des Ressources des ARS, ainsi que les accréditations des professionnels de santé et d'ouvrir progressivement les données de la rémunération sur objectifs de santé publique (ROSP)" (p.49). Ambitieux...

Lire : Conventionnement des professions libérales, vers la fin d'un système ?

Afin de renforcer l'aspect de sécurité et de qualité des soins, l’Open Data doit être enclenché en amont de tout nouveau projet financé sur fonds publics dans le domaine de la santé. Notamment l’ANSM, qui travaille actuellement à la refonte de la base de pharmacovigilance. Au-delà des enjeux de gouvernance autour de la publication de ces données, le CISS a révélé que finalement les membres de la Commission Open Data avaient reçu un projet de dispositions législatives relatif à l'Open Data en santé . Un texte bien loin de leurs recommandations, avant même que le rapport ait été publié...

Oups ! Encore un rapport pour rien ?

 

À propos de Vincent Fromentin

Blogueur santé et directeur de publication de La Lettre de Galilée. Voir tous ses articles.

En continuant à utiliser le site, vous acceptez l’utilisation des cookies. Plus d’informations

Les paramètres des cookies sur ce site sont définis sur « accepter les cookies » pour vous offrir la meilleure expérience de navigation possible. Si vous continuez à utiliser ce site sans changer vos paramètres de cookies ou si vous cliquez sur "Accepter" ci-dessous, vous consentez à cela.

Fermer