Accueil / Les éditos des différentes Lettres de Galilée / Health Data Hub : faut-il craindre l’exploitation de nos données de santé ?

Health Data Hub : faut-il craindre l’exploitation de nos données de santé ?

Éditorial de la 480ème

À la suite de la remise du rapport Villani sur l'Intelligence Artificielle, en mars 2018, Emmanuel Macron avait annoncé dans son discours de clôture au Collège de France, la création d'un "véritable hub des données de santé", sur la base d'une "structure partenariale entre producteurs et utilisateurs des données", qui enrichirait l'actuel système national de données de santé, pour y inclure,"l'ensemble des données remboursées par l'Assurance-maladie, en ajoutant les données cliniques des hôpitaux, les données de la médecine de ville, ainsi que les données de grande qualité, scientifique et médicale, créées dans le cadre de cohortes nationales (...), dans un cadre parfaitement sécurisé, garantissant l'anonymat et le respect de chaque individu".

Lire : Rapport Villani sur l’Intelligence Artificielle : quelles perspectives pour la santé ?

La genèse du projet

Un des points forts de la stratégie Intelligence Artificielle française validé par la Ministre de la Santé le 12 juin 2018 qui a mis en place pour cela une mission de préfiguration de cette plateforme d’exploitation des données de santé avec trois experts : Marc Cuggia, praticien hospitalier du CHU de Rennes, spécialiste de l'informatique médicale, à l'origine de eHop, une plateforme numérique Big Data qui centralise les données médicales de l'hôpital, Dominique Polton, haut fonctionnaire de l'Assurance maladie et actuelle présidente de l'Institut National des Données de Santé (INDS), "point d’entrée unique des demandes d’accès aux données du Système National des Données de Santé (SNDS) et plus largement de toutes les études, recherches ou évaluations nécessitant l’utilisation de données de santé n'impliquant pas la personne humaine" et Gilles Wainrib, jeune polytechnicien à l'origine de Owkin, une startup qui a développé un modèle d’analyse révolutionnaire appelé MesoNet à l'origine d'une découverte majeure dans le traitement de la biologie tumorale expliquée dans un article publié, en octobre dernier, dans la revue Nature Medicine. Une start-up dans le vent qui a d'ailleurs levé plusieurs millions auprès de Google...

Lire : Big Data en santé : le grand naufrage européen

L'idée, depuis l'ouverture initiée par la loi Touraine, est de compléter les bases du Système national d’information interrégimes de l’assurance maladie (SNIIRAM) qui centralise l’ensemble des données de liquidation des prestations de tous les bénéficiaires des régimes d’assurance maladie obligatoire de base. Avec l’article 193 de la loi de modernisation de notre système de santé, différentes "briques" devaient être ajoutées à cet entrepôt : données PMSI gérées par l’ATIH, données CepiDc gérée par l’INSERM sur les causes de décès, des données médico-sociales du système d'information (MDPH, CAF, CNSA) et un échantillon représentatif des données de remboursement par bénéficiaire transmises par des organismes d'assurance maladie complémentaire et défini en concertation avec leurs représentants. Dès lors, un problème de gouvernance se posait. La Drees avait été désignée pour en assumer l'élaboration et la gouvernance.

Lire : Cybersécurité, nos données de santé sont-elles en sécurité ?

Les risques de détournement et de piratage

Aujourd'hui, le Hub doit chapeauter toute cette infrastructure en tant qu'interlocuteur unique. En plus de toutes les données collectées par le SNDS depuis 2016, le Hub permettra d'y inclure désormais l’ensemble des données cliniques recueillies par les professionnels de santé dans le cadre de leurs activités et liées aux actes ou prestations remboursés. Ce sont ainsi toutes les données traitées dans les logiciels métiers des médecins ou dans les logiciels de prescription des pharmaciens qui seraient aspirées par ce gigantesque entrepôt.

Lire : Comment les Big data sauveront nos vies

La CNIL en janvier dernier avait rendu un avis assez circonspect sur l'extension du périmètre du SNDS : "Au-delà d’un simple élargissement, cette évolution change la dimension même du SNDS (...). la Commission appelle dès maintenant l’attention sur la problématique majeure du respect, en pratique, des principes de limitation des finalités et de minimisation des données par ces nouveaux traitements, évoluant dans un contexte d’accumulation de données pour alimenter les algorithmes d’intelligence artificielle."

Lire : La soli-data-rité ou l’extension du concept de solidarité aux données personnelles de santé

Dès lors, deux questions se posent. Collecter des données de manière sécurisée est une chose. L'héberger est une autre. Or, n'est pas hébergeur qui veut... La solution la plus sécurisée retenue est le cloud. Et l'hébergeur retenu pour le Health Data Hub français : Microsoft Azure. Un géant des GAFAM.

Lire : Cambridge Analytica : quand on découvre benoîtement la toute puissance des GAFA

On se souvient de l'article dans le Wall Street Journal du 11 novembre dernier qui révélait le "Projet Nightingale" : une utilisation par le cloud de Google de données non anonymisées autorisées par une organisation hospitalière privée du Missouri. Sans l'accord des patients ou des professionnels de santé.

Lire : Santé connectée : faut-il craindre les robots ?

Quelle confiance accorder aux GAFAM ?  D'autant qu'aujourd'hui, la loi de santé Touraine a modifié les motifs d'utilisation des données : l’arrêté relatif à la mise en place du SNIIRAM en 2004 interdisait explicitement l’accès aux organismes privés à but lucratif, l’article 193 de la loi de santé autorise l’accès au SNDS sous certaines conditions. Le motif d’intérêt scientifique a disparu au profit de celui de l’intérêt général.

Lire : Données personnelles de santé : un trésor envié et sous-exploité

Autre sujet : le piratage informatique auquel sont confrontés de nombreux hôpitaux. En France, en 2016 déjà, la Cour des Comptes avait relevé les nombreuses failles sécuritaires observées dans le SNIIRAM. Citant un rapport de test d’intrusion remontant à 2010, "un attaquant n’ayant pas de compte sur le portail ne pouvait réaliser aucune action dangereuse pour le SNIIRAM, mais que toute personne ayant un compte sur le portail du SNIIRAM, même en accès très limité, pouvait rebondir sur une grande partie du système d’information de la CNAMTS".

Lire : Les données de santé en libre échange

Plusieurs risques étaient en partie classés comme étant d’une gravité majeure, avec une probabilité ou un impact "catastrophiques" (p.39). Alors que la CNAMTS s'apparente pleinement à un "hébergeur de données de santé", elle n'a pas besoin de solliciter un quelconque agrément (notamment demandé aux hébergeurs privés), profitant d'un aménagement législatif de 2015. L'agrément n'est ainsi obligatoire que pour les hébergeurs assurant un "dépôt et une restitution de données sans réutilisation de celles-ci pour d’autres fins". Ce qui n'est pas le cas pour le SNIIRAM où les données peuvent être réutilisées à d’autres fins... De plus, comme la CNAMTS n'est pas classée comme un "opérateur d’importance vitale", elle n'est soumise à aucune inspection de la sécurité de ses systèmes d'information.

Lire : Quel avenir pour nos données personnelles de santé ?

Risques de réidentification

Dans une récente publication de la revue Nature Communications, des chercheurs ont réussi à démontrer qu'une personne anonyme peut être identifiée dans n'importe quelle base de données en utilisant seulement 15 attributs démographiques. Une quinzaine de caractéristiques suffisent à identifier une donnée sensée rester anonyme. Et une donnée anonyme n'est plus considérée comme une donnée personnelle. Le partage de données anonymes échappe donc à toute règlementation, notamment le fameux  règlement général de protection des données personnelles européen (RGPD).

Lire : Règlement général de protection des données personnelles : la pagaille commence

Le Gouvernement et la CNIL ont beau rassurer, la méfiance est générale. Faut-il craindre ce nouveau Big Brother médical ?

Lire : L’ubérisation de la santé est en marche

L'État connaîtra tout de nous !

Au-delà des crispations entendues ici ou là dans la presse, le principal danger de ce Hub est l'aspiration de toutes nos données de santé par l'État lui-même. Il a réalisé enfin sa tentation : aspirer toutes nos données médicales, du fichier de l'Assurance maladie jusqu'à nos consultations de médecin traitant.

Lire : Données de santé : l’irrésistible aspiration de l’État

Autre critique de ce Léviathan santé concerne l'hébergement auprès de Microsoft. Car, depuis l'adoption par les États-Unis en mars 2018 du "Cloud Act", les forces de l'ordre ou les agences de renseignement américaines peuvent obtenir sans motif les données stockées par les sociétés de Cloud computing américaines. Les prestataires de services doivent communiquer "les contenus de communications électroniques et tout enregistrement ou autre information relatifs à un client ou abonné, qui sont en leur possession ou dont ils ont la garde ou le contrôle, que ces communications, enregistrements ou autres informations soient localisés à l’intérieur ou à l’extérieur des Etats-Unis". Grosso modo, "une agence de renseignement américaine peut récupérer légalement des données de santé d'un citoyen français sans son consentement" explique Alice Vitard dans l'Usine Digitale.

L'autre risque rarement évoqué par la presse repose sur le piratage des systèmes locaux. Et en premier lieu, les hôpitaux français qui sont souvent victimes de ransomware. Ce phénomène est passé sous silence mais il est massif tant la cybersécurité est la dernière des priorités des établissements de santé. La Cour des Comptes avait alerté sur la vulnérabilité des données stockées dans le SNIIRAM.

Dernière crainte,  la réidentification possible de données supposées anonymes. Plus le périmètre des bases grandi, plus il est possible de recouper les informations avec différentes variables et d'individualiser la donnée. Si les pouvoirs publics souhaitent mettre l'éthique au coeur des problématiques de gestion de données santé en France, le système ne pourra pas se passer des GAFAM ni pour leur stockage étendu de données ni pour leur capacité de calcul algorithmique. Aucun ordinateur en France ne dispose de leur puissance de calcul.

Alors oui. Il va falloir admettre l'exploitation financière de nos données de santé.

Crédits photos : roryms.

 

 

À propos de Vincent Fromentin

Blogueur santé et directeur de publication de La Lettre de Galilée.Voir tous ses articles.
Contenu non disponible.
Merci d’accepter les cookies en cliquant sur « Accepter » sur la bannière.
x

Lisez-aussi

Hors série n°3 : Cybersécurité, nos données de santé sont-elles en sécurité ?

Pour faire face aux attaques de plus en plus nombreuses qui visent ...

En continuant à utiliser le site, vous acceptez l’utilisation des cookies. Plus d’informations

Les paramètres des cookies sur ce site sont définis sur « accepter les cookies » pour vous offrir la meilleure expérience de navigation possible. Si vous continuez à utiliser ce site sans changer vos paramètres de cookies ou si vous cliquez sur "Accepter" ci-dessous, vous consentez à cela.

Fermer