Les Data Challenges en santé
“Une approche innovante et participative qui favorise l'émergence et le partage de solutions inédites en santé numérique”

Les Data Challenges sont des compétitions en science des données qui visent à répondre à des problématiques médicales précises à l’aide de l’analyse des données mises à disposition.
Il s’agit plus précisément de résoudre, en un temps imparti, une problématique spécifique de data science grâce à des solutions d’apprentissage supervisé. Ces compétitions se déroulent en ligne et sont généralement des problèmes de prédictions, de régressions ou de classification, préalablement formulés sur la base de larges jeux de données et mis à disposition des compétiteurs.
En s’inscrivant dans une démarche d’intelligence collective et d’ouverture de la science, l’idée pour les organisateurs et les compétiteurs est de mettre leurs forces en commun afin d’accéder, à l’état de l’art de la problématique scientifique, statistique ou technique posée.
L’origine de l’initiative Data Challenges en santé
Dans le cadre du plan France 2030, le Gouvernement a lancé la stratégie d’accélération « Santé Numérique » visant à préparer l’avenir et faire de la France un leader en santé numérique. C’est dans ce contexte que la Délégation ministérielle au Numérique en Santé, le Secrétariat général pour l’investissement, en charge de France 2030, et le Health Data Hub ont lancé l’initiative Data Challenge en santé.
Ainsi, depuis 2020, par le biais des Appels à Projets “Data Challenges en santé”, le HDH accompagne des acteurs de l'écosystème de la santé dans l’organisation de projets de Data Challenge portant sur des thématiques médicales d’intérêt et à portée internationale. Ces projets bénéficient d’un soutien financier de Bpifrance ainsi que d’un accompagnement logistique, technique et organisationnel de bout en bout par les équipes du Health Data Hub.
Découvrez et participez aux compétitions Data Challenges en santé
Les Data Challenges en santé sont des compétitions ouvertes à tous et d’envergure internationale. Aucun prérequis n’est nécessaire, l’inscription et la participation sont gratuites. Pour ne rien rater, vous pouvez vous inscrire à notre newsletter pour être informé du lancement de tous nos Data Challenges.
Nos Data Challenges en santé en cours d’organisation
Le Health Data Hub accompagne actuellement différents partenaires issus de l’écosystème de la santé dans l’organisation de Data Challenges portant sur des bases de données inédites et des thématiques médicales variées.
- Le Data Challenge DigiLUT porté par l’Hôpital Foch sera dédié à la détection de zones pathologiques sur des biopsies de transplantation pulmonaire. L’objectif étant le développement d’un algorithme capable de détecter un rejet de greffe ainsi que sa sévérité à partir de lames de biopsies numérisées.
- Le Data Challenge proposé par la Société Française de Chirurgie Thoracique et Cardiovasculaire s’intéressera à la problématique du cancer du poumon. L’objectif pour les participants sera de définir une classification histopronostique des tumeurs neuroendocrines pulmonaires, à partir de données d’imagerie cellulaire.
- Dans le domaine de la neurologie, la Société Française de Médecine Nucléaire organisera un challenge consacré aux syndrômes parkinsoniens. Les participants auront pour mission de développer un algorithme contribuant au diagnostic de ces syndrômes aux formes multiples. Des données d’imagerie cérébrale appelées DatScan seront mises à disposition pour le challenge.
- Le Data Challenge CYTOLOGIA, porté par le Groupe Francophone d’Hématologies Cellulaires, vise à développer une solution d’intelligence artificielle à partir d’une très large base d’images de leucocytes normaux et pathologiques issus de frottis sanguins. Le but étant d’aider à la classification automatique des leucocytes pour standardiser les pratiques et homogénéiser les compétences diagnostiques.
- La stéatose hépatique non alcoolique (NAFLD), une maladie caractérisée par une accumulation excessive de graisse du foie, toucherait aujourd’hui 25% de la population générale. ANNITIA, de l’IHU ICAN, a pour objectif de stratifier le risque de progression de la maladie en modélisant l’évolution de l’état de santé du patient.
- CardI-HACK, de l’IHU ICAN également, se penchera sur les Cardiomyopathies hypertrophiques (CMH) afin d’identifier de nouveaux scores biocliniques capables de mieux prédire leur diagnostic. Le Data Challenge combine des données génétiques et cliniques détaillées.
Retour sur nos Data Challenges finalisés
- Prédire la récidive à cinq ans des patients atteints de mélanome à partir d’images numérisées de lames de biopsies : le Data Challenge VisioMel porté par la Société Française de Pathologie, la Société Française de Dermatologie, le Groupe de Cancérologie Cutanée et le Conseil National Professionnel des Pathologistes a rassemblé 541 participants. 637 algorithmes ont été soumis jusqu’à la clôture de la compétition, donnant lieu à des résultats très encourageants: en moyenne, les algorithmes des lauréats ont correctement détecté 73% des cas de rechutes et 75% des cas qui n’ont pas rechuté à cinq ans. Des analyses supplémentaires sont actuellement en cours pour déterminer si les algorithmes se révèlent performants dans certaines catégories diagnostiques spécifiques.
Une cérémonie de remise des prix, organisée le 25 mai 2023 à PariSanté Campus, a permis de récompenser les lauréats à la compétition et de présenter les premiers résultats. Découvrez les résultats et les interviews des lauréats à la compétition sur ce lien.
Porté par les Hôpitaux Universitaires de Strasbourg, le Data Challenge D-IA-GNO-DENT s’est concentré sur le sujet des maladies orales et dentaires rares. L’objectif pour les participants était de proposer des algorithmes de diagnostic automatique à partir de photographies de dents en identifiant les traits caractéristiques de ces maladies génétiques. Au total, 1451 modèles ont été soumis par 84 candidats, avec des scores allant jusqu’à 0,8385.
- Plus d’informations sur les résultats de D-IA-GNO-DENT ici.
Prédire la présence ou non d’une maladie allergique et sa sévérité à partir de données immunologiques : l’Allergen Chip Challenge de la Société Française d’Allergologie espère voir émerger des solutions innovantes qui pourront améliorer la prise en charge des patients allergiques. Clôturé mi-juillet 2023, 3135 modèles ont été soumis par 292 candidats à travers le monde. Les premières analyses des résultats sont actuellement en cours.
- Plus d’informations sur les résultats d’Allergen Chip Challenge ici.
Porteur de projet ? Organisez votre compétition sur une thématique médicale d’intérêt !
La Délégation ministérielle au Numérique en Santé, le Secrétariat général pour l’investissement, en charge de France 2030, et le Health Data Hub sont à l’origine d’Appels à Projets “Data Challenges en santé” auxquels les acteurs de l’écosystème désireux d’organiser leur propre compétition peuvent candidater. A l’occasion d’une troisième édition, l'initiative est renouvelée à travers un appel à projets (AAP) du même nom.
L’appel à projets sera ouvert de juillet 2023 à juin 2025. Trois relèves espacées d’environ huit mois seront organisées, la première étant prévue le 29 février 2024. A l’issue de chaque relève, les candidatures seront étudiées par un jury afin d’établir une présélection sur la base de critères prédéfinis.
Le 11 octobre 2023, le Health Data Hub organisait un webinaire dédié à la présentation de l’AAP et aux modalités de candidature. Le replay du webinaire est disponible suivant ce lien.
Vous pouvez également retrouver toutes les informations sur l’Appel à Projets “Data Challenges en santé” sur le lien suivant ou en nous contactant à l’adresse suivante : data.challenge@health-data-hub.fr. Les lauréats bénéficient d’un soutien financier de Bpifrance dans le cadre du programme Grand Défi et d’un accompagnement du Health Data Hub sur les plans organisationnel, logistique et technique.
Les bonne pratiques pour organiser un Data Challenge en Santé
L’organisation d’un Data Challenge en santé requiert des étapes de cadrage scientifique, méthodologique, financier et règlementaire spécifiques à la réutilisation de données de santé. Pour mener un projet de ce type de façon conforme, en particulier sur le plan réglementaire, et obtenir des résultats robustes, il est important de s’informer sur les bonnes pratiques à suivre pour organiser un Data Challenge en santé.
Découvrez le MOOC “Data Challenges en santé” pour vous former sur ces bonnes pratiques.
Retrouvez également tous les éléments de bonnes pratiques en téléchargeant notre Kit Data Challenge.
Les publications en lien avec les Data Challenges en santé
