N° 25672436

Patho Carto : Développement d’algorithmes de détection des pathologies en soins primaires dans P4DP et évaluation de la concordance avec celles issues du SNDS

Partager

Objectif(s) de la recherche et intérêt pour la santé publique

Finalité de l'étude

Recherche, étude, évaluation

Objectifs poursuivis

Autre

Domaines médicaux investigués

Médecine générale

Bénéfices attendus

Le projet PathoCarto vise à améliorer l’exploitation des données de santé en développant et en évaluant des algorithmes de détection des pathologies adaptés aux soins de ville. Il répond à un enjeu majeur de santé publique : disposer d’outils fiables et validés pour analyser les pathologies et leur prise en charge, afin d’éclairer la recherche mais aussi possiblement le pilotage des politiques de santé et la compréhension des dépenses de santé.

L’étude consiste à développer des algorithmes de détection de pathologies dans la base nationale P4DP, puis à comparer leurs résultats avec ceux de la cartographie nationale des pathologies de la CNAM. Elle repose sur l’analyse de données déjà existantes, dans une approche croisant expertise médicale et méthodes de data science.

La population inclut des patients adultes et enfants suivis en médecine générale dans le réseau national P4DP.

Données utilisées

Catégories de données utilisées

Informations relatives aux pathologies des personnes concernées
Informations recueillies à l'occasion d'activités de prévention, de diagnostic, de soins ou de suivi social et médico-social

Autre(s) catégorie(s) de donnée(s) utilisée(s)

les données concernant : la consultation, le patient (clef patient, âge, sexe,...), les diagnostics et les critères de diagnostics, ses antécédents, symptômes, médicaments et autres prescriptions.

Source de données utilisées

Base principale du SNDS
Base du catalogue SNDS

Composante(s) de la base principale du SNDS mobilisée(s)

PMSI

Appariement entre les sources de données mobilisées

  Non

Variables sensibles utilisées

Date de soins (JJ/MM/AAAA)

Justification du recours à cette(ces) variable(s) sensible(s)

La date de soin précise est indispensable pour : Reconstituer les trajectoires de soins individuelles (séquences d’actes, hospitalisations, prescriptions, examens), nécessaires à la modélisation des parcours patients. Évaluer la temporalité des événements médicaux (délais entre diagnostic, traitement et complication, durée de suivi, épisodes aigus vs chroniques). Améliorer la qualité des algorithmes d’apprentissage : les modèles prédictifs nécessitent des informations temporelles précises pour identifier des séquences causales et évaluer la performance en conditions réalistes.

L’accès à la date de soin (JJ/MM/AAAA) est donc requis pour la reconstitution des parcours de soins et la modélisation temporelle des événements médicaux. Cette variable est indispensable à la validité scientifique des analyses et des algorithmes développés.

Conscients du caractère indirectement identifiant de cette variable, nous limitons le risque via un traitement en environnement sécurisé, la pseudonymisation et la séparation logique des données, l’usage transitoire des dates (remplacées par intervalles/agrégats avant toute diffusion), la traçabilité des accès et une charte de confidentialité. En outre, nous n’avons pas sélectionné les pathologies très rares, afin de limiter la singularité des observations et de réduire la probabilité de réidentification indirecte. Ces mesures rendent le risque résiduel minimal tout en préservant la validité scientifique des analyses.

Recours au numéro d'identification des professionnels de santé

  Non

Plateforme utilisée pour l'analyse des données

Plateforme technologique du HDH

Acteurs finançant et participant à l'étude

Responsable(s) de traitement

Type de responsable de traitement 1

Etablissement privé de santé (dont fédération)

Responsable de traitement 1

GIE ipso

323 Rue Saint-Martin 75003 Paris 75003 Paris France

Localisation du responsable de traitement 1
  Dans l'UE
Représentant du responsable de traitement 1

Responsable(s) de mise en oeuvre non cités comme responsable de traitement

Responsable de mise en oeuvre non cité comme responsable de traitement 1

Nicolas De Chanaud

323 Rue Saint-Martin 75003 Paris 75003 Paris France

Calendrier du projet

Date de début : 01/10/2025 – Date de fin : 01/06/2027 Durée de l'étude : 18
Etape 1 : Dépôt du projet
09/09/2025
Etape 2 : Complétude
15/10/2025
Etape 3 : Avis CEREES/CESREES
06/11/2025
Etape 4 : Sens avis CEREES/CESREES
Réservé

Base légale pour accéder aux données

Encadrement réglementaire

Autorisation CNIL

Destinataire(s) des données

Destinataire des données 1

ipso santé

323 Rue Saint-Martin 75003 Paris 75003 Paris France

Durée de conservation aux fins du projet (en années)

3

Existence d'une prise de décision automatisée

  Non

Fondement juridique

Article 6 du RGPD (Licéité du traitement)

(1)(e) exécution d’une mission d’intérêt public

Article 9 du RGPD (Exception permettant de traiter des données de santé)

8; 9

Transfert de données personnelles vers un pays hors UE

  Non

Droits des personnes

Droit d’accès, de rectification, d’effacement, de limitation, de portabilité et d’opposition s’exercent directement auprès du responsable du traitement de la base source : P4DP, conformément aux dispositions légales.

Délégué à la protection des données

ipso santé

323 Rue Saint-Martin 75003 Paris 75003 Paris France