Digital Society Forum Digital Society Forum
Focus 24/04/2020

L’enjeu majeur des données de santé

Avec la numérisation croissante de nos vies et de nos pratiques, les données de santé ont explosé. Elles constituent aujourd'hui un enjeu majeur (crédit : ForthWithLife , CC BY 2.0)
Dans le domaine de l’IA et de la santé, tout commence par les données. Algorithmes d’aide au diagnostic, méthodes de recherches innovantes découvrant des corrélations ou des phénomènes insoupçonnés, amélioration du soin via l’informatique... toutes ces promesses de l’amélioration de la médecine par le numérique reposent sur les données de santé. Elles sont un « trésor » particulièrement convoité — mais également particulièrement sensible. Tour d’horizon.

L’explosion des données de santé avec le Big Data


L’idée de recueillir et conserver des données relatives à la santé n’est pas née avec le numérique. En France, le Programme de Médicalisation des Systèmes d’Information (PMSI), une base de données concernant l’hôpital, est créé dans les années 1980 tandis qu’à la décennie suivante est lancé le « système national d’information inter-régimes d’assurance maladie » , une base de données médico-administratives qui regroupe le détail de toutes les feuilles de soin ainsi que les données de facturation hospitalière, avec un système de données pseudonymisées.
Mais avec la numérisation croissante, le nombre et la nature des données de santé disponibles se sont multipliés. Avec l’entrée dans le régime des données massives, le Big Data, caractérisé par l’explosion des capteurs, des capacités de stockage et des capacités de traitement des données, il est devenu possible d’exploiter d’énormes volumes de données, qu’elles soient structurées (comme des résultats de tests, des remboursements de soins...) ou non structurées (compte-rendus d’hospitalisation, échanges sur les réseaux sociaux...).

Une catégorie très large...


C’est pourquoi aujourd’hui, la définition d’une donnée de santé est très large. En 2018, le Règlement Général de la Protection des Données les a décrit comme « les données à caractère personnel relatives à la santé physique ou mentale d’une personne physique, y compris la prestation de services de soins de santé, qui révèlent des informations sur l’état de santé de cette personne. » Ceci inclut « toute information concernant une maladie, un handicap, un risque de maladie, les antécédents médicaux, un traitement clinique ou l’état physiologique ou biomédical de la personne concernée, indépendamment de sa source. » Cette dernière précision est cruciale, car les sources utilisées pour générées des données de santé sont de plus en plus diverses.
Classiquement, les données de santé sont produites pendant les parcours de soin, tout au long de la vie d’une personne. Il peut s’agir des données entrées par des médecins ou des professionnels de santé dans des dossiers électroniques, d’analyses de laboratoire, des données générées par des dispositifs médicaux connectés ou produites par les tests génétiques...
Les données de santé proviennent aussi des actes administratifs qui balisent la vie sanitaire : concernant la facturation, le remboursement des soins, l’enregistrement des décès, ou encore des informations sur les médicaments délivrés, les motifs d’hospitalisation etc.
Enfin, les données peuvent avoir été recueillies auprès de patients via des enquêtes, des questionnaires etc.

... qui a explosé avec la numérisation croissante de nos vies


Mais les données de santé englobent aussi, et de plus en plus, d’autres types de données, issues de la numérisation croissante de nos vies.
Ce sont par exemple les données produites par les objets connectés liés à la santé (montres comme Apple Watch, bracelets Fitbit, balances connectées) ou des applications de santé. Mais ce sont aussi les données générées par nos activités en ligne : nos recherches sur des moteurs de recherche, nos activités sur des plateformes de rendez-vous médicaux, des réseaux sociaux de patients, des sites de ventes en ligne de médicaments etc.
C’est pourquoi, face à cette démultiplication des sources, la CNIL précise que les données de santé peuvent l’être « par nature » (antécédents médicaux, traitements suivis, maladies etc.), mais aussi le devenir en contexte. Ainsi, certaines données deviennent des données de santé « par croisement » : quand elles permettent, croisées avec d’autres, de tirer des conclusions sur l’état de santé d’une personne. Ainsi une application qui mesurerait le nombre de pas effectués par une personne ainsi que les calories qu’elle absorbe chaque jour pourrait en déduire des informations sur son état probable de santé. Certaines données deviennent aussi données de santé « par destination », selon l’utilisation qui en est faite au plan médical.
Inversement, précise la CNIL, des données qui ne permettent pas de tirer des conséquences sur l’état de santé d’une personne ne seront pas considérées comme des données de santé (par exemple une application qui enregistre le nombre de pas faits pendant une promenade, sans les croiser avec d’autres données de santé).

Fluidifier les parcours de santé


Aux yeux de nombreux professionnels de santé, ces données, bien utilisées, peuvent grandement participer à améliorer le système de soin, et l’aider à répondre aux défis que représentent le vieillissement de la population et le développement de maladies chroniques.
Selon Dominique Polton , directeur de l’Institut National des Données de Santé , les données de santé peuvent permettre de transformer le système de soin en l’organisant davantage autour du patient, par exemple en harmonisant et en fluidifiant les parcours de soin, ainsi qu’en favorisant les échanges d’informations. C’est l’idée centrale du projet de Dossier Médical Partagé, lancé en 2004 et ayant connu depuis une mise en place compliquée .

Ainsi, explique le professeur Etienne Minvielle , directeur de recherche et chargé de mission parcours innovants à Gustave Roussy : « En oncologie, à Gustave Roussy, l’hôpital pour lequel je travaille, ils viennent pour des durées assez brèves, repartent à domicile où ils peuvent être hospitalisés. lls doivent entretenir des contacts avec des médecins généralistes, des infirmières libérales, des aides ménagères… Les pharmaciens de ville ont aussi un rôle dans leur parcours patient. Beaucoup d’options, beaucoup de contacts, beaucoup d’étapes donc…» L’usage et le partage des données de santé pourrait permettre de coordonner les parcours de soin et jouer un rôle essentiel auprès des professionnels comme des patients : « Une radio prise dans un hôpital de proximité peut, par exemple être analysée et interprétée par un neurologue du CHU à distance. Le patient peut avoir accès à des expertises qu’il n’avait pas jusqu’ici. Cela pousse à plus de coordination, à ce que le dossier numérique soit partagé entre toutes les composantes professionnelles d’un GHT. La plateforme numérique permet en outre à tout patient de s’orienter dans ces systèmes. »

Donner au patient un rôle plus actif dans le parcours de soins


L’usage des données de santé peut également permettre aux patients de prendre une place plus importante et plus active dans leur parcours de soin, notamment via les applications de suivi médical et les communautés de patients.
Les expériences proposant aux patients de monitorer eux-mêmes certains indicateurs de santé pour pouvoir adapter les traitements se multiplient. Une expérience en cours dans un centre anti-cancéreux propose à des patients souffrant de cancer du poumon d’informer en continu les médecins via une application. Ces données sont traitées par un algorithme entraîné à repérer les signes avant-coureurs de rechute. Selon les premiers résultats, le dispositif s’est révélé plus efficace que des traitements plus onéreux pour prolonger d’environ sept mois la vie des patients.
Avec les outils numériques, les patients peuvent être de plus en plus actifs dans leurs parcours de soin. Certains se sont ainsi constitués en communautés de patients, sur des plateformes numériques et hors des circuits médicaux traditionnels, pour échanger sur leur maladie et développer leurs savoirs propres. C’est le cas de Renaloo , qui s’adresse aux personnes souffrant de diverses maladies rénales, ou encore de ComPaRe, développée par l’AP-HP.
Enfin, toujours selon Dominique Polton , le traitement et le partage de ces données peut permettre d’optimiser le système de soins dans son ensemble. L’exploitation des bases de données de l’assurance maladie peut permettre de surveiller l’évolution de certaines maladies, voire dépister des risques sanitaires à grande échelle. Polton cite ainsi le potentiel des bases de données de l’assurance maladie, dont l’exploitation offre de possibles « bénéfices collectifs » : surveillance sanitaire, détection de risques sanitaires, analyse à grande échelle de l’effet de certains traitements etc. De telles analyses ont ainsi permis de déceler les risques d’embolie pulmonaire associés à certaines pilules contraceptives.

Ces données peuvent enfin servir à la recherche scientifique, ainsi qu’à de nouvelles formes de recherche, comme la recherche participative. C’est le cas, en France, de la plateforme ComPaRe ou encore du projet Epidemium : un projet de « recherche communautaire » qui propose à des volontaires de se saisir de jeux de données ouvertes pour faire avancer la recherche en cancérologie.

Et les promesses de l’IA


Mais ces usages, si prometteurs et essentiels soient-ils dans une société confrontée au défi de son vieillissement, ne suffisent pas à eux seuls à expliquer l’intérêt et l’effervescence commerciale constatée autour des données de santé.
Les données de santé, combinées à des techniques d’intelligence artificielle, offrent la promesse d’une transformation profonde de la médecine, vers un modèle parfois décrit comme celui des «4P » : prédictive, préventive, personnalisée et participative.
L’idée est d’appliquer des programmes en IA à de vastes quantité de données médicales pour en tirer de nouvelles connaissances ou de nouvelles pistes de diagnostic. Une des applications de Watson, un des programmes d’IA construits par IBM, permet ainsi d’analyser très rapidement les données d’un patient ainsi qu’un grand nombre de travaux scientifiques pour faire des propositions thérapeutiques. Des dispositifs d’IA ont déjà obtenu de meilleurs résultats en termes de diagnostics pour l’analyse des radios et le dépistage de certains cancers de la peau. Pour l’épidémiologiste Philippe Ravaud , déjà à l’origine de la plateforme ComPaRe, avec l’IA : « On va pouvoir identifier de manière plus précise les rechutes de malades chroniques avant leurs manifestations classiques » et « accompagner en temps réel des patients – avec le “Just-in-Time Adaptive Intervention (JITAI)” – afin de modifier des comportements à risque et adapter par exemple le traitement par insuline de personnes diabétiques ou l’alimentation d’un malade pour modifier son microbiote ».
Une autre promesse est celle de la médecine dite « personnalisée », où l’on pourrait développer des modèles prédictifs, capables de décrire des trajectoires probables pour un patient en comparant ses données avec une masse de données produites par d’autres patients et d’autres connaissances scientifiques.

Des enjeux commerciaux


Ces données sont loin de n’intéresser que les acteurs publics : elles sont fortement convoitées et activement recherchées par un nombre croissant d’acteurs privés. Avec la baisse du coût de développement des logiciels, l’explosion des données avec l’Internet des Objets, mais aussi l’assouplissement de la législation (“l'indispensable marquage CE n'est plus un obstacle pour des entrepreneurs qui sont de plus en plus aguerris”, se félicite un converti dans La Tribune ) et le changement de mentalités (« Doctolib mène depuis plusieurs années un énorme travail d'évangélisation auprès des médecins sur la productivité et la santé de demain”, note le même auteur ), le secteur de la « health tech » est une des nouvelles frontières de l’économie numérique.

Un peu partout services et applications traitant des données de santé se multiplient.
En France, la start-up Embleema propose à ses usagers de centraliser et de vendre leurs données de santé . Les laboratoires Pierre Servier et Fabre ont déjà engagé des partenariats avec elle.
Deux start-ups soutenues par la Croix-Rouge et la Fondation Roche, proposent des solutions axées sur l’utilisation des données de santé pour la logistique : Arkhn cherche à créer une base dedonnées dans chaque établissement de santé pour faciliter l’interopérabilité et la communication entre les différentes structures, tandis que Jalgos développe des algorithmes de prédiction de l’affluence aux urgences, pour rendre automatique la gestion des stocks de pharmacie et rationnaliser l’organisation.

D’autres proposent des utilisations plus futuristes et sujettes à caution. Le Monde en a recensé certaines : ainsi l’entreprise américaine Chronos propose de projeter le vieillissement d’une personne à partir d’un selfie, pour aider les entreprises d’assurance à calculer des primes. Au Japon, Symax Inc propose aux entreprises un dispositif d’analyse des urines installé sur les toilettes, pour des salariés volontaires. Au Canada, la start-up Animo propose d’analyser les écrits des salariés (leurs mails ou leur messagerie instantanée) pour évaluer leur santé mentale.

Quelles que soient la fiabilité et la précision de tels outils, leur existence montre qu’il existe un possible marché pour des développements commerciaux de telles applications.
Cela n’a pas échappé aux géants du numérique qui se sont lancés depuis déjà plusieurs années dans le secteur : d’abord en offrant des solutions de stockage (c’est ainsi Microsoft qui héberge la plateforme Health Data Hub) mais aussi en développant des objets connectés de santé (comme l’Apple Watch ou l’appli Fitbit, acquise par Google en 2019). De son côté, Amazon développe en toute discrétion ses propres projets autour de la collecte et du traitement de données de santé, incluant télémédecine, pharmacie et assurance.

De plus en plus, les GAFAM cherchent aussi à entrer dans le domaine de la recherche : en créant des partenariats avec des universités pour accéder à leurs données, et lancer des projets de recherche collaboratifs entre chercheurs du public et du privé.

En France aussi, le marché se structure et attire de plus en plus d’investisseurs. En 2019 le secteur des « Health Tech » (les technologies de santé) a levé 1,8 milliard d’euros en France, dont 60 % de capital-risque. Ceci représente une augmentation de 79 % par rapport à l’année 2018.

Des limites importantes : la protection des données sensibles


Compte tenu du caractère extrêmement sensible de ces données, leur utilisation est extrêmement encadrée et réglementée.
Mais en Europe, les données de santé sont considérées comme des données sensibles, du même ordre que les données sur des opinions politiques ou une appartenance ethnique. Elles sont donc particulièrement protégées et en principe, leur traitement est interdit, sauf exceptions bien précises. En France, les données de santé peuvent être utilisées pour des traitements ayant une finalité d’intérêt public, en particulier dans le cadre de la recherche — après autorisation de la CNIL. Des entreprises peuvent également les utiliser, à la condition expresse qu’elles aient reçu le consentement « libre, éclairé, spécifique et univoque » de l’usager. Ceci implique que l’usager soit clairement informé – et exclut donc les dispositifs de consentement enfouis dans des Conditions générales d’utilisation interminables et illisibles.

Les difficultés de l’ouverture des données de santé


Une autre difficulté tient au fait qu’il n’existe pas encore de grande base de données de santé unifiée en France. Chaque hôpital, CHU, laboratoire de ville... a pu constituer sa base de données de soin et l’interconnexion de celles-ci est encore loin d’être acquise. Or, comme le rappelle une enquête du Monde, les problèmes d’interconnexion des données ne sont pas que techniques : entrent également en ligne de compte des débats sur la propriété intellectuelle. Selon la responsable du Health Data Hub, interviewée par Le Monde : « Certains CHU ou centres de recherche veulent que chaque société privée qui va accéder aux données contractualise avec eux et se mette d’accord sur un partage de la valeur créée. Nous pensons de notre côté qu’un retour sur investissement pour l’effort de la collecte est nécessaire, mais que cela ne doit pas forcément entraîner un contrat avec accès aux bénéfices potentiels. »
En France, le Système National des Données de santé a été lancé en 2016, et le Health Data Hub , « plateforme de données de santé » en 2019. Avec ce dernier, il s’agit pour la France de se doter d’une gigantesque base de données rassemblant des données issues du système de santé publique, et de l’ouvrir à la recherche mais aussi, selon conditions, à des initiatives privées.
Ces données ne sont pas hébergées chez le français OVH mais sur des serveurs Microsoft, situés en France. Toutes les entreprises qui voudront y avoir accès, qu’elles soient publiques ou privées, devront obtenir l’accord de la CNIL et justifier d’un projet d’intérêt général.
Health Data Hub lance chaque année des appels à projets en direction des entreprises privées ou publiques souhaitant avoir accès aux données de la plateforme. Dix projets ont été sélectionnés en avril 2019 , et le prochain appel est en cours.

Comment protéger ces données extrêmement sensibles ? Comment réussir à favoriser à la la fois l’accès aux données et à la connaissance qui pourrait en résulter, tout en protégeant leur anonymat et en prévenant le risque de réidentification des personnes ? Comme nous l'expliquait le spécialiste en informatique Benjamin Nguyen , il n’est pas possible d’obtenir une anonymisation parfaite : par nature, les traces que génèrent les individus sont « extrêmement uniques » et il est possible de réidentifier un individu en croisant plusieurs données. Les solutions qui permettent une grande anonymisation se font aux dépens de la précision des données. « On ne peut pas avoir une analyse de qualité maximale et une protection intégrale des individus », rappelle Benjamin Nguyen. La « privacy » est toujours un compromis social : c’est de celui-ci que la société doit aujourd’hui collectivement débattre.


Les commentaires

Pour réagir à cet article, je me connecte Je m’inscris

Soyez le premier à réagir !

S’inscrire et participer

Inscrivez vous sur le Digital Society Forum pour commenter et réagir sur les articles et être informé des événements à venir

DSF