ProdroBrain – Prodrome des maladies neurodégénératives avec complications motrices et impact sur la progression
Objectif(s) de la recherche et intérêt pour la santé publique
Finalité de l'étude
Objectifs poursuivis
Domaines médicaux investigués
Bénéfices attendus
Les maladies neurologiques avec complications motrices, qui sont des maladies chroniques liées à l’âge et qui touchent le système nerveux posent de nombreux défis. Si ces pathologies se distinguent par des schémas spécifiques de vulnérabilité des neurones moteurs, elles partagent une certaine homogénéité et un socle commun qui restent à caractériser. En termes d’atteintes moteur, par exemple, dans la sclérose latérale amyotrophique, les neurones moteurs supérieurs et inférieurs dégénèrent, entraînant une faiblesse musculaire et une paralysie. La maladie de Parkinson, en revanche, est marquée par la dégénérescence des neurones producteurs de dopamine dans la substance noire, causant des tremblements, de la rigidité et une lenteur des mouvements.1,2 La sclérose en plaques se caractérise par une attaque du système immunitaire contre la myéline, perturbant la transmission des signaux nerveux et provoquant une variété de symptômes tels que la faiblesse musculaire, les problèmes de coordination, les troubles visuels et cognitifs.3,4 Enfin, la maladie d’Huntington est causée par une mutation génétique entraînant la dégénérescence des neurones dans certaines régions du cerveau, provoquant des mouvements involontaires, des troubles cognitifs et des changements comportementaux. Bien que ces maladies diffèrent dans le type d’atteinte du système moteur, elles partagent toutes des symptômes prodromiques, c'est-à-dire des manifestations cliniques précoces précédant l’apparition des premiers signes neurologiques spécifiques de la maladie.
Mieux comprendre la phase prodromique de ces maladies neurodégénératives et les comparer entre elles est essentiel pour améliorer leur prévention.5–8 Cette phase représente le stade précoce et préclinique d'une maladie, durant lequel des symptômes subtils et certains biomarqueurs commencent à apparaître avant que le syndrome clinique complet ne se manifeste. En identifiant et en caractérisant ces signes précoces, les cliniciens peuvent intervenir plus tôt, retardant potentiellement ou même empêchant la progression vers des stades plus graves de la maladie. La détection précoce grâce aux marqueurs prodromiques permet de mettre en œuvre des changements de mode de vie, des interventions pharmacologiques et des stratégies de suivi qui peuvent réduire les facteurs de risque et améliorer la qualité de vie des patients.7,8 De plus, comprendre comment le prodrome de chaque maladie neurodégénérative est spécifique peut guider le développement de nouvelles cibles thérapeutiques, conduisant à des traitements plus efficaces et personnalisés.
Notre objectif est de comprendre comment la phase prodromique est liée au pronostic des maladies neurodégénératives,3,9,10 en développant des algorithmes de prédiction à partir des données chaînées du Système National des Données de Santé (SNDS) et de l’Entrepôt de Données de Santé de l’AP-HP (EDS-APHP). L’identification précoce des individus à risque de développer des complications graves est essentielle pour mettre en place des interventions ciblées et en temps opportun. Toutefois, le défi réside dans la capacité à identifier ces individus à haut risque avec précision. Notre stratégie consiste à exploiter les données cliniques issues de l’EDS afin de détecter les facteurs de risque biomédicaux pertinents.
L’originalité majeure de ce projet est de comparer les prodromes des quatre plus importantes maladies neurodégénératives s’exprimant par des symptômes moteurs (Sclérose en plaque, Maladie de Parkinson, Sclérose Latérale Amyotrophique et Maladie de Huntington) dans le but d’identifier des prodromes communs à ces maladies d’expression motrice, ainsi que les prodromes spécifiques à chacune des maladies. Nous pourrons ensuite mesurer l’impact pronostic de chaque prodrome pour chaque pathologie et éventuellement isoler certains prodromes de bon ou mauvais pronostic dans l’ensemble des pathologies neurodégénératives à symptômes moteurs. Pour toutes ces raisons, il est absolument crucial de pouvoir comparer les données relatives à ces quatre pathologies.
Ce projet vise à relier la phase prodromique au pronostic des maladies neurodégénératives en utilisant des études d’associations et des algorithmes de prédiction à partir des données chaînées du SNDS et de l'EDS-APHP. L'objectif principal est d'identifier des indicateurs clés du prodrome permettant de prédire l'évolution de la maladie et l’apparition des complications graves. En exploitant les données cliniques de l’EDS et en les comparant aux facteurs prodromaux des maladies pour identifier les facteurs de risque biomédicaux, cette étude vise à améliorer la détection précoce et les interventions ciblées, contribuant ainsi à une prise en charge plus efficace et personnalisée des patients.
Objectifs :
1. Identifier des indicateurs prodromiques associés à l’apparition de complications graves : Le premier objectif est d'identifier des indicateurs clés dans la phase prodromique qui sont associés à des résultats cliniques graves, tels que la première hospitalisation liée à une complication de la maladie ou/et la mortalité. Ces complications peuvent être identifiées comme la nécessité de ventilation non invasive (VNI), de gastrostomie, ou une combinaison de ces complications comme dans la sclérose latérale amyotrophique ou l’initiation de traitement de secondes lignes (pompe à Apomorphine, stimulation cérébrale profonde pour le parkinson, natalizumab ou ocrelizumab pour la SEP). En examinant ces associations, nous visons à mieux comprendre les facteurs précoces qui peuvent prédire l’apparition de complications et ainsi aider à la planification d’interventions précoces. Nous analyserons le parcours de soin des patients avant leur diagnostic, en se basant sur les affections de longue durée, diagnostics associés à des hospitalisations classifiées comme comorbidités précliniques selon la classification CIM-10, les prescriptions médicamenteuses codées par la classification ATC, et la consommation de soin codée selon la classification des actes de la CCAM. Cette analyse s'appuiera sur les données longitudinales du Système National des Données de Santé (SNDS) et de l’Entrepôt de Données de Santé - Assistance Publique - Hôpitaux de Paris (EDS-APHP), afin de corréler comment les signes précoces peuvent influencer la progression des maladies.
2. Identifier des indicateurs prodromiques pour la prédiction de la progression des scores cliniques : Le deuxième objectif est de repérer des signes précoces dans la phase prodromique qui pourraient prédire l'évolution des scores cliniques clés pour chaque maladie neurodégénérative étudiée. Pour la SEP, cela concerne le score EDSS (Expanded Disability Status Scale) ; pour la maladie de Parkinson (MP), le score UPDRS (Unified Parkinson’s Disease Rating Scale) ; pour la sclérose latérale amyotrophique (SLA), le score ALSFRS-R (ALS Functional Rating Scale-Revised) ; le score UHDRS (Unified. Huntington Disease rating Scale) pour la maladie d’Huntington.
3. Développements méthodologiques permettant l’étude du prodrome des maladies neurodégénératives : Développer et valider des algorithmes de (i) repérage du retard d’encodage dans le SNDS en comparant la date à laquelle nous retrouvons la 1ere consommation de soins reliée à la pathologie dans le SNDS et la date de début des symptômes et de diagnostic, disponibles dans l’EDS et (ii) ciblage dans le SNDS des patients atteints de MP / SEP / SLA / Maladie d’Huntington grâce aux données cliniques de l’EDS.
4. Comparer les maladies à symptômes moteurs : Le quatrième et dernier objectif vise à mieux comprendre comment ces quatre maladies neurodégénératives diffèrent ou se rejoignent en termes de présentation clinique prodromale, et de corrélation entre le prodrome et l’évolution de la maladie. Cette approche comparative nous permettra non seulement d’identifier des indicateurs et un socle communs pouvant prédire l’évolution ou les complications, mais aussi de mieux cibler les interventions thérapeutiques en fonction des spécificités de chaque pathologie.
La thématique du projet s’inscrit dans le cadre plan interministériel maladies neurodégénératives (PMND) qui constituent un défi pour notre système de santé et la politique de recherche. Avec une prévalence croissante due au vieillissement de la population, ces maladies représentent un lourd fardeau médical, humain et économique. Améliorer la prévention est crucial pour réduire leur incidence et limiter leur impact. En identifiant précisément les premiers signes, ce projet permettra d’affiner les stratégies de prévention, d’optimiser la gestion des patients, et de réduire les coûts tout en améliorant leur qualité de vie.
Ce projet s’inscrit également dans une stratégie globale de l’ICM, qui a récemment initié la création de la cohorte NeuroPrems, visant à suivre des patients prodromaux de différentes maladies neurodégénératives. Bien que les objectifs soient similaires, les deux projets sont complémentaires : NeuroPrems vise à étudier le prodrome à partir d’une cohorte de patients parfaitement phénotypés avec de nombreux marqueurs biologiques, mais porte sur un nombre relativement restreint de patients. ProdroBrain se concentrera sur une population beaucoup plus large, en vie réelle, plus représentative de la population générale, mais avec un phénotypage moins complet et moins de données biologiques et neurologiques disponibles. Les résultats scientifiques de ces deux études, complémentaires, permettront d’identifier des mécanismes ou des facteurs de risque communs qui pourraient contribuer au développement d’approches de prévention et de traitement plus efficaces.
Les résultats seront accessibles à la communauté scientifique à travers des publications, des conférences, et, lorsque cela sera pertinent, par le partage de programmes et d'outils sur des plateformes comme GitHub. Ces outils seront mis à la disposition d'autres chercheurs pour des études futures, via des réseaux tels que Redsiam, visant à centraliser les algorithmes de ciblage du SNDS et à promouvoir l’échange d’expertise et la collaboration entre équipes.
Données utilisées
Catégories de données utilisées
Autre(s) catégorie(s) de donnée(s) utilisée(s)
Variable SNDS : Notre étude nécessite les éléments suivants concernant les bénéficiaires dans le SNDS :
1. Date de naissance du bénéficiaire ( aaaa) : La date de naissance sera généralisée à l’année de naissance (aaaa), ce qui est suffisant pour notre analyse. L’âge des patients est crucial pour éviter tout biais dans l’étude. Par exemple, il est bien établi que la prévalence de certaines maladies neurodégénératives augmente avec l’âge.
A noter que la variable date de naissance au format mois-année (mm/aaaa) ne sera utilisée que pour l’appariement indirect.
2. Sexe du bénéficiaire : Cette variable est également essentielle pour éviter les biais et pour l’appariement des données.
3. Date de décès (jj/mm/aaaa) : La variable sensible date de décès au format jj/mm/aaaa sera nécessaire. En effet, l e décès est un événement clé dans l’analyse de la sévérité des pathologies neurodégénératives et constitue un risque compétitif pour analyser les risques de progression significative (e.g : décès survenant avant de débuter un traitement de seconde ligne).
4. Causes de décès : Les causes de décès permettront de distinguer si certains prodromes ou parcours sont associés à un sur-risque de décès lié à certaines pathologies spécifiques.
5. Dates de début et de fin de soins / séjours hospitaliers (jj/mm/aaaa) : Ces dates sont indispensables pour caractériser les parcours de soins, car les événements (par exemple, une consultation suivie de la dispensation de médicaments en pharmacie) sont souvent séparés par des périodes de moins d’un mois. La précision quotidienne est donc justifiée et nécessaire pour notre appariement.
6. Délivrances de médicaments en ville donnant lieu à des remboursements : Ils sont utilisés pour caractériser le prodrome des maladies en identifiant des médicaments prescrits pour certains symptômes potentiellement prodromaux (ex : laxatifs pour une constipation dans la maladie de Parkinson).
7. Délivrance de soins : Ces informations sont également nécessaires pour caractériser le prodrome (ex : coloscopie pour explorer une constipation sévère dans le cadre d’une maladie de Parkinson, visites chez le médecin généraliste…).
8. Commune de résidence : Cette information est nécessaire pour calculer l’indice de déprivation (Fdep) à l’échelle de la commune, facteur important qui pourrait être predictif d’une aggravation plus rapide de la maladie.
Concernant la consommation de soins, l’identification des prodromes, l’élaboration des algorithmes de sélection de cas et la modélisation des parcours de soins nécessitent les informations suivantes :
● Codage des médicaments délivrés : Pour comprendre les traitements prescrits.
● Codes CIM-10 issus du PMSI pour les séjours hospitaliers : Ils sont utilisés pour coder les diagnostics et les interventions médicales.
● Affections de Longue Durée (ALD) : Pour identifier les patients atteints de maladies chroniques nécessitant des soins prolongés.
● Actes CCAM (PMSI et DCIR) : Pour repérer les complications des différentes maladies telle que la VNI, la mise en place d’une gastrostomie, ou la stimulation cérébrale profonde.
Si la période de ciblage est du 01.01.2017 au 31.12.2023, une fois l’appariement indirect réalisé, les données du SNDS seront extraites du 01.01.2009 au 31.12.2023. En effet pour étudier le prodrome, nous utiliserons les données de consommation de soin avant la date diagnostic et utiliserons donc tout l’historique SNDS disponible. Il est établi que les premiers signes des maladies neurodégénératives peuvent apparaître au moins 10 ans avant le diagnostic. Ainsi, pour étudier pleinement cette phase prodromique, il serait idéal de disposer d’au moins 15 ans d’historique, permettant d’observer une période suffisamment longue (3 à 5 ans) sans prodrome, suivie de son apparition progressive dans les données. Par exemple, pour les patients diagnostiqués en 2023, un historique remontant à 2009 offrirait 14 ans de données, ce qui permettrait d’identifier une période sans prodrome, puis d’en détecter statistiquement l’apparition . Cette année de 2009 est également la première année (les données du SNDS pouvant remonter jusqu’à 2006) de quasi-exhaustivité des régimes principaux (Régime Général, ex-SLM, ex-RSI et MSA). Elle constitue donc le compromis idéal entre qualité des données et antériorité suffisante pour l’identification des prodromes.
Nous utiliserons les différentes tables PMSI (PMSI-MCO, PMSI-HAD, PMSI-SSR, PMSI-RIP), toutes sont nécessaires pour identifier les différentes complications amenant à des hospitalisations (PMSI-MCO et PMSI-HAD, PMSI-SSR) et des complications psychiatriques (PMSI_RIP). Les données du CépiDc ne sont nécessaires qu’à partir du 01/01/2017 puisque par définition de l’extraction EDS, aucun patient n’a pu décéder avant le 01/01/2017. Le référentiel pharmacie (IR_PHA_R) est aussi nécessaire puisqu’il permet d’extraire la consommation de médicament avant le diagnostic permettant de caractériser le prodrome.
La durée d’accès aux données demandée est de trois ans à compter de la mise à disposition des données permettant de réaliser la validation des différentes algorithmes, l’étude du prodrome de chacune des maladies ainsi que la comparaison.
Variable EDS : Extraction des Scores Cliniques, des Variables Environnementales et des dates de diagnostic / début des symptômes de l'EDS-APHP lors des Visites Initiales et de Suivi
Nous extrairons des données complètes sur les scores cliniques de base et de suivi :
● EDSS pour la SEP : L'Échelle Élargie d'État de Handicap (EDSS) permet de quantifier le handicap dans la SEP.
● UPDRS pour la MP : L'Échelle Unifiée d'Évaluation de la Maladie de Parkinson (UPDRS) suit l'évolution de la maladie.
● ALSFRS-R pour la SLA : L'Échelle Révisée de Cotation de la Fonctionnelle de la SLA (ALSFRS-R) évalue l'état fonctionnel des patients atteints de SLA.
● UHDRS pour la Maladie d’Huntington : L'atteinte neurologique liée à la maladie est évaluée grâce à l'échelle UHDRS, reconnue internationalement.
Nous collecterons également des données environnementales et socio-économiques, telles que la consommation de tabac et d'alcool, le statut socio-économique et l'indice de masse corporelle (IMC).
● Informations sur le Diagnostic : Extraction des données de diagnostic détaillées de l'EDS-APHP pour chaque patient.
● Temps de Diagnostic : Importation des dates ou périodes précises de diagnostic.
● Variables Environnementales et Scores Cliniques : Intégration des variables diversifiées décrites précédemment.
Source de données utilisées
Composante(s) de la base principale du SNDS mobilisée(s)
Appariement entre les sources de données mobilisées
Source(s) de données appariées
Notre projet s'appuie sur la base de données EDS-APHP (Entrepôt de Données de Santé - Assistance Publique - Hôpitaux de Paris) pour constituer un échantillon de patients atteints de pathologies neurologiques à symptômes moteurs. Ces cohortes, enrichies par des données détaillées sur le parcours de soins issues du SNDS (Système National des Données de Santé), permettront de comparer les phases prodromiques de ces maladies et d’évaluer leur impact sur le pronostic.
L’EDS-APHP intègre les données de santé des patients admis dans les 39 établissements de l’AP-HP, en Ile de France, en consultation ou en hospitalisation. La constitution de l’EDS à des fins de recherche a été autorisée par la CNIL le 19 janvier 2017 (Délibération n° 2017-013).
Il contient principalement des données cliniques : données sociodémographiques, dossiers patients, comptes rendus médicaux, diagnostics et actes, des résultats d’imagerie et de biologie ainsi que des données de signaux.
Type d'appariement
Plateforme utilisée pour l'analyse des données
Acteurs finançant et participant à l'étude
Responsable(s) de traitement
Type de responsable de traitement 1
Responsable de traitement 1
Localisation du responsable de traitement 1
Représentant du responsable de traitement 1
Responsable(s) de mise en oeuvre non cités comme responsable de traitement
Responsable de mise en oeuvre non cité comme responsable de traitement 1
Calendrier du projet
Base légale pour accéder aux données
Encadrement réglementaire
Durée de conservation aux fins du projet (en années)
3
Existence d'une prise de décision automatisée
Fondement juridique
Article 6 du RGPD (Licéité du traitement)
Article 9 du RGPD (Exception permettant de traiter des données de santé)
Transfert de données personnelles vers un pays hors UE
Droits des personnes
S’agissant du droit à l’information :
Dans la mesure où l’étude porte sur une extraction des données de l’EDS appariées aux données du SNDS, les personnes concernées doivent être individuellement informées du traitement nécessaire à la mise en œuvre de l’étude et c’est sur l’ICM que pèse juridiquement cette obligation. Il est toutefois impossible à l’ICM de communiquer les informations requises aux personnes concernées compte tenu de leur nombre très important (154 624 patients selon l’estimation présentée dans la section 3.4) et des efforts disproportionnés qui seraient nécessaires pour retrouver leur identité. L’étude Prodrobrain est, en effet, une étude rétrospective sur données déjà collectées. Qu’il s’agisse des données du SNDS ou les données de l’EDS, le responsable de traitement (ICM) n’est pas en charge des bases de données « source ». Il n’est donc pas en mesure de contacter directement les patients concernés puisqu’il ne dispose ni de leur identité, ni de leurs coordonnées.
S’agissant des données de l’EDS, l’ICM fournira à l’APHP toutes les informations nécessaires sur le projet pour que l’AP-HP puisse les diffuser sur le Portail de transparence dédié aux traitements mis en œuvre à partir des données de l’entrepôt et délivrer ainsi une information conforme aux textes. Une notice d’information conforme aux dispositions des articles 13 et 14 du RGPD a été rédigée et sera transmise à l’AP à cette fin (V. annexe- ??).
Pour ce qui est des données du SNDS, l’ICM sollicite une dérogation à l’obligation d’information individuelle auprès de la CNIL et effectuera toutes les diligences pour qu’une information générale relative à l’étude et conforme aux dispositions de l’article 14-5b) du RGPD soit rendue publiquement disponible, notamment par la diffusion de la notice d’information précitée sur le portail de transparence du site internet de l’ICM, du HDH et de la CNAM.
Pour l’exercice des autres droits :
Concernant les données provenant de l’EDS, les personnes concernées ont été informées qu’elles disposent des droits suivants
- droit d’accès aux données personnelles les concernant.
- droit de rectification : correction de données inexactes, incomplètes ou équivoques.
- droit de suppression de ces données.
- droit d’opposition à l’utilisation de leurs données à des fins de recherche médicale.
- droit de définir des directives relatives à la conservation, à l’effacement et à la communication de ces données les concernant après leur décès.
Elles sont également informées qu’elles peuvent exercer leurs droits en s’adressant au directeur de l’hôpital ou du groupe hospitalier où elles ont été soignées. Elles ont également la possibilité d’exercer un droit d’opposition à l’utilisation de leurs données à des fins de recherche et sont en mesure de le faire en ligne grâce à un formulaire mis à leur disposition. Cette procédure est détaillée sur le site de l’EDS.18
Concernant les données provenant du Système National de l’Information Inter-Régimes de l’Assurance Maladie (SNIIRAM) incluse dans le SNDS, les personnes concernées souhaitant faire valoir leurs droits devront en faire la demande auprès du directeur de l’organisme gestionnaire du régime d’assurance maladie obligatoire auquel la personne est rattachée, conformément à l’article R1461-9 du code de la santé publique. Cette procédure est détaillée sur le site du SNDS.19
En outre et afin de faciliter l’exercice des droits des personnes, celles-ci pourront également contacter directement la DPO de l’ICM dont les coordonnées seront publiées. Cette dernière pourra les diriger vers la bonne procédure et entrera en contact avec les DPOs des fournisseurs de données si nécessaire.