N° 22054838

Développement et validation d’un algorithme d’identification de la dermatite atopique à partir des données de la cohorte Constances chainées au Système national des données de santé

Partager

Objectif(s) de la recherche et intérêt pour la santé publique

Finalité de l'étude

Recherche, étude, évaluation

Objectifs poursuivis

Diagnostics

Domaines médicaux investigués

Dermatologie, vénérologie

Bénéfices attendus

Intérêt pour la santé publique : L’algorithme de dermatite atopique (DA) validé ou développé permettra de réaliser de nombreuses recherches sur cette pathologie à partir des données du Système national des données de santé (SNDS), notamment dans les domaines de l’épidémiologie et de la sécurité des médicaments.

Objectifs : (1) Développer et valider un algorithme pour identifier les patients atteints de DA dans le SNDS après avoir testé l'algorithme existant ; (2) Adapter l’algorithme développé (1) pour identifier les personnes atteintes de DA traitées avec des traitements systémiques non biologiques, puis valider ses performances.

Méthode : Pour atteindre l'objectif 1, le(s) algorithme(s) de DA publié(s) et, si nécessaire, les algorithmes adaptés seront testés dans la cohorte CONSTANCES 2018 en utilisant le diagnostic de DA issu de CONSTANCES. Un tableau de contingence sera créé présentant les vrais positifs (VP), les vrais négatifs (VN), les faux positifs (FP) et les faux négatifs (FN). Les performances diagnostiques seront évaluées par la valeur prédictive positive (VPP), la valeur prédictive négative (VPN), la sensibilité, la spécificité et leurs intervalles de confiance à 95 % (IC à 95 %), ainsi que par le score F1. Si le(s) algorithme(s) de DA adapté(s) ne permettent pas d'identifier correctement les personnes atteintes de DA dans la cohorte CONSTANCES 2018, un nouvel algorithme sera développé dans la cohorte d’entrainement en utilisant et en comparant plusieurs méthodes de machine learning supervisé [ex : régression logistique pénalisée LASSO, arbres de décision, forêts aléatoires, gradient boosting machine, réseaux de neurones, superlearner]. La cohorte de validation sera ensuite utilisée pour évaluer les performances du nouvel algorithme (VP, VN, FP, FN, VPP, VPN, sensibilité, spécificité, score F1 et AUC-ROC.
Pour atteindre l'objectif 2, si l'algorithme de DA le plus performant de l'objectif 1 provient de l'algorithme publié (avec ou sans adaptation), celui-ci sera testé dans le sous-groupe de personnes ayant reçu des traitements systémiques non biologiques. Les différentes métriques (VP, VN, FP et FN et les VPP, VPN, sensibilité, spécificité et score F1) seront calculées. Si cet algorithme n'identifie pas correctement les personnes atteintes de DA, un nouvel algorithme sera développé et validé dans ce sous-groupe à l'aide de cohortes d’entrainement et de validation distinctes comme décrit à l'étape précédente.

Population : Ensemble des participants CONSTANCES, âgés de 18 ans ou plus en 2018, avec des informations sur le diagnostic de DA et avec un historique de 5 ans dans le SNDS avant le questionnaire CONSTANCES de 2018

Données utilisées

Catégories de données utilisées

Informations relatives aux pathologies des personnes concernées

Source de données utilisées

Autre

Autre(s) source(s) de donnée(s) mobilisée(s)

Cohorte(s)

Appariement entre les sources de données mobilisées

  Non

Plateforme utilisée pour l'analyse des données

Système fils pour les données issues du SNDS

Acteurs finançant et participant à l'étude

Responsable(s) de traitement

Type de responsable de traitement 1

Université, école, structure de recherches dans le domaine médicale / épidémiologique / pharmacovigilance

Responsable de traitement 1

Université de Bordeaux

35 place Bey Perland 33000 Bordeaux France

Localisation du responsable de traitement 1
  Dans l'UE
Représentant du responsable de traitement 1

Calendrier du projet

Date de début : 31/01/2025 – Date de fin : 31/03/2026 Durée de l'étude : 13
Etape 1 : Dépôt du projet
27/01/2025

Base légale pour accéder aux données

Encadrement réglementaire

Méthodologie de référence 004

Destinataire(s) des données

Destinataire des données 1

Plateforme BPE

146 rue Léo Saignat 33076 Bordeaux cedex France

Durée de conservation aux fins du projet (en années)

2

Existence d'une prise de décision automatisée

  Non

Fondement juridique

Article 6 du RGPD (Licéité du traitement)

(1)(e) exécution d’une mission d’intérêt public

Article 9 du RGPD (Exception permettant de traiter des données de santé)

(2)(j) archives, recherche scientifique ou historique, ou statistiques

Transfert de données personnelles vers un pays hors UE

  Non

Droits des personnes

Les personnes concernées ont été informées de la possibilité que leurs données soient réutilisées à des fins de recherche lors de leur participation à la cohorte Constances. Une information collective spécifique sur le projet sera diffusée dans le journal de la cohorte Constances, ainsi que sur le site internet de Constances et de la plateforme BPE.

Délégué à la protection des données

Université de Bordeaux

35 Place Pey Berland 33000 Bordeaux France

dpo@u-bordeaux.fr