02/07/2025

Publication en open data de CytologIA : une base de données inédite d’images anonymes de leucocytes normaux et pathologiques

À la une
Partager
open data cytologIA

La base de données CytologIA est désormais disponible en open data. Elle a été créée dans le cadre du data challenge éponyme. Ce défi, porté par le Groupe Francophone d’Hématologie Cellulaire (GFHC) et Algoscope, a été lancé fin 2024. Il avait pour objectif d’améliorer le diagnostic en hématologie biologique grâce à l’IA en développant des modèles de classification automatique des leucocytes.

 

A travers ce challenge, les compétiteurs devaient développer des modèles d’apprentissage automatique capables de classifier les leucocytes normaux et pathologiques selon 23 classes à partir de près de 75 000 images issues de 23 centres. La compétition a rassemblé près de 250 compétiteurs ayant produit environ 2 000 algorithmes prometteurs avec des scores de performance allant jusqu’à 93 % de classifications correctes. A l’issue de celle-ci, les algorithmes lauréats du data challenge CytologIA ont été publiés en open source afin de bénéficier au plus grand nombre. 

Mise en open data de la base de données anonymisées CytologIA

 

Au-delà du développement et de la publication d’algorithmes d’intelligence artificielle performants, ce data challenge a également permis de soutenir la création d’une base de données anonymisées inédite et de grande qualité rassemblant près de 75 000 images de 23 classes de leucocytes normaux et pathologiques, et issues de 23 centres inclueurs francophones. Une base de données d’environ 70 000 images anonymisées a été ouverte. 

 

Les images numériques de biopsies étant particulièrement volumineuses, l’hébergement des données directement sur la plateforme de référencement - data.gouv.fr - n’est pas possible. Une infrastructure de stockage souveraine adaptée a donc été mise en place par le Health Data Hub afin de répondre à ce besoin. Cette infrastructure est proposée à tout porteur de projet pour l’hébergement gratuit des bases de données anonymes à ouvrir dont la volumétrie excède 1 Go.

 

Base de données ouverte CytologIA

 

Pour en savoir plus sur l’offre de service du HDH, vous pouvez nous contacter à l’adresse opensource@health-data-hub.fr et également visionner le replay d’une intervention dédiée en suivant ce lien.