ONCOVAL
Objectif(s) de la recherche et intérêt pour la santé publique
Finalité de l'étude
Objectifs poursuivis
Domaines médicaux investigués
Bénéfices attendus
Le projet ONCOVAL s’inscrit dans le cadre de l’appel à manifestation d’intérêt “Partage de données industrielles”, lancé par le Health Data Hub (HDH), et qui rappelle que, depuis sa création, le HDH s’est fortement mobilisé auprès des acteurs en charge de bases de données pour leur constitution, leur enrichissement ou leur partage. Le HDH a investi depuis 4 ans pour favoriser le partage des données publiques et a mis en production une plateforme technologique qui permet le stockage de bases de données et la constitution d’un catalogue à disposition des porteurs projets.
Le HDH s’est engagé aujourd’hui dans une réflexion plus structurante pour développer des actions à destination des acteurs privés s’agissant du partage des données dont ils sont dépositaires.
En termes de partage des données, Roche est le premier à s'être lancé dans l'aventure avec le partage d'une de ses bases au catalogue. Toutefois, malgré quelques cas d'usage, l'exploitation des données privées est demeurée confidentielle. En réponse à l’appel à manifestation d’intérêt, le présent Projet vise à multiplier des opportunités d’exploration et de réutilisation de données collectées par des acteurs industriels.
Il permet également de favoriser partage des données d’origine privée dans le contexte européen de l'adoption du règlement relatif à l'espace européen des données de santé (EHDS) et des travaux de préfiguration en cours, notamment ceux menés par un consortium d'acteurs européens emmené par le HDH.
La libération des données, facteur d’accélération de la recherche
L'intérêt public du Projet Oncoval découle du fait qu’il vise à libérer la circulation des données utiles à la recherche, du fait d'un type d'anonymisation (avatarisation) qui les fait échapper à la catégorie des données personnelles dont l’utilisation est légalement restrictive, tout en conservant à ces données leur utilité pour la recherche.
L'effet accélérateur pour la recherche permis par l’avatarisation va ainsi favoriser les buts poursuivis par les producteurs des bases de données retraitées, tant dans le domaine de la recherche médicale que dans celui du progrès médico-social, spécialement pour améliorer la diffusion des thérapeutiques en prenant en considération leurs coûts de développement par rapport au bilan de leur avantage thérapeutique. Le bénéfice est donc direct pour les acteurs de la santé, pour les individus et pour la société.
La conformité à l’article 66, I, de la Loi n° 78-17 du 6 janvier 1978 est ainsi assurée.
Par ailleurs, le Projet s’inscrit dans plusieurs des finalités d’utilité reconnue : l’évaluation de la prise en charge médico-sociale, la connaissance des dépenses de santé, l’information des professionnels sur leur activité.
Le responsable du traitement n’étant pas un industriel des produits de santé, ni un assureur, la question des finalités interdites n’est pas en cause.
Enfin, le Projet s’inscrit dans la continuité de cas d’usage concrets et démontrés (ex : Roche), confirmant à la fois la faisabilité, la valeur ajoutée et le potentiel de généralisation de cette approche pour l’intérêt public.
Le recours à l’Open source, facteur de réplicabilité
En rendant les données de santé accessibles sous forme anonymisée et partageable, ONCOVAL favorise l’émergence de projets de recherche en IA, accélère les publications scientifiques, et réduit les délais de collaboration inter-établissements.
Somme toute, le projet ONCOVAL s’inscrit pleinement dans une démarche d’intérêt public, à la croisée de trois enjeux majeurs :
(i) Accélérer la recherche médicale et l’innovation en santé :
En facilitant l’accès à des données de qualité, anonymisées et exploitables, ONCOVAL contribue à nourrir des projets de recherche en intelligence artificielle, en épidémiologie, en amélioration des parcours de soins ou en évaluation de stratégies thérapeutiques. Ces projets bénéficient à l’ensemble de la société en permettant des avancées scientifiques et cliniques plus rapides.
(ii) Renforcer la transparence et la reproductibilité scientifique :
ONCOVAL prévoit la mise à disposition en Open source des outils, méthodes et jeux de données simulés (scripts d’anonymisation, cahiers des charges, pipelines de traitement, rapports techniques, jeux de données non sensibles). La mise à disposition en Open source des outils et jeux de données (sous licence permissive Apache), qui est centrale, est pleinement intégrée au projet : scripts, cahiers des charges, subsets de données et rapports d’anonymisation seront librement accessibles, pour encourager la réplication des résultats et la reproductibilité scientifique, en cohérence avec les principes de l’Open Science. Cette ouverture s’inscrit en effet dans la logique de science ouverte, promue par l’État et les institutions de l’Union Européenne, en vue de garantir la réplicabilité des résultats et d’encourager les collaborations interdisciplinaires.
(iii) Offrir un cadre reproductible, réutilisable et conforme aux standards :
En publiant les briques techniques et méthodologiques utilisées, ONCOVAL entend permettre à d’autres établissements de santé ou consortiums publics de répliquer l’approche, réduisant les inégalités d’accès à l’innovation entre structures, tout en garantissant une conformité stricte avec les exigences du RGPD.
Ainsi, la mise à disposition en Open source n’est pas accessoire : elle est au cœur de la stratégie d’intérêt général du projet, en assurant transparence, partage de savoirs, montée en compétences des acteurs publics, et en maximisant l’impact collectif des investissements réalisés.
Données utilisées
Catégories de données utilisées
Autre(s) catégorie(s) de donnée(s) utilisée(s)
Même si des identifiants directs sont supprimés, d'autres variables (par exemple : âge, code postal, profession, date de naissance, etc.) peuvent, une fois combinées, former un "quasi-identifiant" unique permettant de retrouver l'identité d'une personne. L'utilisation de toutes les variables disponibles est une étape critique pour la robustesse de l'avatarisation. Cette approche permet d'identifier et de neutraliser tous les vecteurs potentiels de ré-identification, assurant ainsi un niveau d'anonymisation conforme aux exigences strictes du RGPD et des recommandations de la CNIL.
Seront donc utilisées le temps du traitement visant à anonymiser et donc sécuriser les données:
- les données démographiques quasi identifiantes
- les données cliniques issues de l'essai
- les données de marqueurs biologiques et chimiques
Source de données utilisées
Autre(s) source(s) de donnée(s) mobilisée(s)
Appariement entre les sources de données mobilisées
Variables sensibles utilisées
Justification du recours à cette(ces) variable(s) sensible(s)
Même si des identifiants directs sont supprimés, d'autres variables (par exemple : âge, code postal, profession, date de naissance, etc.) peuvent, une fois combinées, former un "quasi-identifiant" unique permettant de retrouver l'identité d'une personne. L'utilisation de toutes les variables disponibles est une étape critique pour la robustesse de l'avatarisation. Cette approche permet d'identifier et de neutraliser tous les vecteurs potentiels de ré-identification, assurant ainsi un niveau d'anonymisation conforme aux exigences strictes du RGPD et des recommandations de la CNIL.
Recours au numéro d'identification des professionnels de santé
Plateforme utilisée pour l'analyse des données
Acteurs finançant et participant à l'étude
Responsable(s) de traitement
Type de responsable de traitement 1
Responsable de traitement 1
Localisation du responsable de traitement 1
Représentant du responsable de traitement 1
Responsable(s) de mise en oeuvre non cités comme responsable de traitement
Responsable de mise en oeuvre non cité comme responsable de traitement 1
Calendrier du projet
Base légale pour accéder aux données
Encadrement réglementaire
Durée de conservation aux fins du projet (en années)
0
Existence d'une prise de décision automatisée
Fondement juridique
Article 6 du RGPD (Licéité du traitement)
Article 9 du RGPD (Exception permettant de traiter des données de santé)
Transfert de données personnelles vers un pays hors UE
Droits des personnes
Concernant les patients figurant dans la base Medipath, le responsable de données Medipath délivre une information individuelle par courrier contenant un lien vers leur portail de transparence, sur lequel sera publiée la note d’information propre au projet Oncoval préalablement au début de l’étude.
Concernant les patients présents dans les bases de données Roche, le Porteur du projet entend pouvoir se prévaloir de l’article 14, 5, b RGPD, qui, formulant ici une exception aux exigences de délivrance d’information, dispose que :
Les paragraphes 1 à 4 ne s'appliquent pas lorsque et dans la mesure où:
b) la fourniture de telles informations se révèle impossible ou exigerait des efforts disproportionnés, en particulier pour le traitement à des fins archivistiques dans l'intérêt public, à des fins de recherche scientifique ou historique ou à des fins statistiques sous réserve des conditions et garanties visées à l'article 89, paragraphe 1, ou dans la mesure où l'obligation visée au paragraphe 1 du présent article est susceptible de rendre impossible ou de compromettre gravement la réalisation des objectifs dudit traitement. En pareils cas, le responsable du traitement prend des mesures appropriées pour protéger les droits et libertés ainsi que les intérêts légitimes de la personne concernée, y compris en rendant les informations publiquement disponibles.
En l’espèce, les efforts nécessaires pour informer individuellement les patients de deux bases de Roche seraient disproportionnés, dans la mesure où :
Les patients ne sont plus suivis dans les centres participants et ne l’étaient déjà plus au moment où le traitement a été autorisé par la CNIL (28 novembre 2019) ;
Le responsable de données lui-même n’avait pas eu la capacité d'informer individuellement ces patients au stade des formalités préalables encadrant ces bases de données .
Pour néanmoins compenser l’absence d’information individuelle , le Porteur du Projet a établi une note d’information collective (Annexée) qui sera publiée sur Internet préalablement à la mise en œuvre du projet.
Cette note informe le patient des droits qu’il peut exercer sur ses données dans le cadre du projet ONCOVAL, à savoir les droits d’accès, de rectification, d’opposition, à la limitation et à l’effacement. Ces droits pourront être exercés avant l’anonymisation des données uniquement, cette opération visant à rendre impossible la réidentification de façon irréversible.