Développement et validation d’un algorithme d’identification de la dermatite atopique à partir des données de la cohorte Constances chainées au Système national des données de santé
Objectif(s) de la recherche et intérêt pour la santé publique
Finalité de l'étude
Objectifs poursuivis
Domaines médicaux investigués
Bénéfices attendus
Intérêt pour la santé publique : L’algorithme de dermatite atopique (DA) validé ou développé permettra de réaliser de nombreuses recherches sur cette pathologie à partir des données du Système national des données de santé (SNDS), notamment dans les domaines de l’épidémiologie et de la sécurité des médicaments.
Objectifs : (1) Développer et valider un algorithme pour identifier les patients atteints de DA dans le SNDS après avoir testé l'algorithme existant ; (2) Adapter l’algorithme développé (1) pour identifier les personnes atteintes de DA traitées avec des traitements systémiques non biologiques, puis valider ses performances.
Méthode : Pour atteindre l'objectif 1, le(s) algorithme(s) de DA publié(s) et, si nécessaire, les algorithmes adaptés seront testés dans la cohorte CONSTANCES 2018 en utilisant le diagnostic de DA issu de CONSTANCES. Un tableau de contingence sera créé présentant les vrais positifs (VP), les vrais négatifs (VN), les faux positifs (FP) et les faux négatifs (FN). Les performances diagnostiques seront évaluées par la valeur prédictive positive (VPP), la valeur prédictive négative (VPN), la sensibilité, la spécificité et leurs intervalles de confiance à 95 % (IC à 95 %), ainsi que par le score F1. Si le(s) algorithme(s) de DA adapté(s) ne permettent pas d'identifier correctement les personnes atteintes de DA dans la cohorte CONSTANCES 2018, un nouvel algorithme sera développé dans la cohorte d’entrainement en utilisant et en comparant plusieurs méthodes de machine learning supervisé [ex : régression logistique pénalisée LASSO, arbres de décision, forêts aléatoires, gradient boosting machine, réseaux de neurones, superlearner]. La cohorte de validation sera ensuite utilisée pour évaluer les performances du nouvel algorithme (VP, VN, FP, FN, VPP, VPN, sensibilité, spécificité, score F1 et AUC-ROC.
Pour atteindre l'objectif 2, si l'algorithme de DA le plus performant de l'objectif 1 provient de l'algorithme publié (avec ou sans adaptation), celui-ci sera testé dans le sous-groupe de personnes ayant reçu des traitements systémiques non biologiques. Les différentes métriques (VP, VN, FP et FN et les VPP, VPN, sensibilité, spécificité et score F1) seront calculées. Si cet algorithme n'identifie pas correctement les personnes atteintes de DA, un nouvel algorithme sera développé et validé dans ce sous-groupe à l'aide de cohortes d’entrainement et de validation distinctes comme décrit à l'étape précédente.
Population : Ensemble des participants CONSTANCES, âgés de 18 ans ou plus en 2018, avec des informations sur le diagnostic de DA et avec un historique de 5 ans dans le SNDS avant le questionnaire CONSTANCES de 2018
Données utilisées
Catégories de données utilisées
Source de données utilisées
Autre(s) source(s) de donnée(s) mobilisée(s)
Appariement entre les sources de données mobilisées
Plateforme utilisée pour l'analyse des données
Acteurs finançant et participant à l'étude
Responsable(s) de traitement
Type de responsable de traitement 1
Responsable de traitement 1
Localisation du responsable de traitement 1
Représentant du responsable de traitement 1
Calendrier du projet
Base légale pour accéder aux données
Encadrement réglementaire
Durée de conservation aux fins du projet (en années)
2
Existence d'une prise de décision automatisée
Fondement juridique
Article 6 du RGPD (Licéité du traitement)
Article 9 du RGPD (Exception permettant de traiter des données de santé)
Transfert de données personnelles vers un pays hors UE
Droits des personnes
Les personnes concernées ont été informées de la possibilité que leurs données soient réutilisées à des fins de recherche lors de leur participation à la cohorte Constances. Une information collective spécifique sur le projet sera diffusée dans le journal de la cohorte Constances, ainsi que sur le site internet de Constances et de la plateforme BPE.