Data challenge Cytolog-IA : automatisation du diagnostic des pathologies en hématologie biologique

GitHub

Lien vers le repo : GitHub

Objectifs de l’algorithme

Outils d’identification de patients / dépistage biologique

Ces algorithmes sont les algorithmes lauréats produits dans le cadre du data challenge Cytolog-IA, porté par le Groupe Francophone d’Hématologie Cellulaire (GFHC) en partenariat avec Algoscope. Au cours de ce challenge, les participants ont eu pour objectif l’automatisation du diagnostic des pathologies en hématologie biologique grâce à l’analyse de données de santé anonymisées. 

Pendant six semaines de compétition intense, près de 250 équipes du monde entier se sont affrontées pour développer des modèles d'IA capables d'améliorer la classification des leucocytes à partir d'images cytologiques. 

L'enjeu était de taille : concevoir des solutions fiables et accessibles pour automatiser cette analyse, aujourd'hui réservée à des experts situés dans des centres de référence.

Les participants ont travaillé sur une base de données unique, rassemblant plus de 70 000 images annotées issues de 23 centres hospitaliers francophones. Avec près de 2 000 modèles soumis, cet engagement marque une étape vers une utilisation généralisée des outils de détection en hématologie. 

Pour en savoir plus sur les data challenges en santé accompagnés par le HDH, rendez-vous ici.

Auteur(s)

Groupe Francophone d'Hématologie Cellulaire (GFHC)

Domaine médical

Cancers

Méthodologie

La méthodologie de construction des algorithmes lauréats est détaillée dans les dépôts GitHub associés.

Langage de programmation

Python

Données utilisées

Données d'application

Données d’imagerie

La numération formule sanguine, une analyse réalisée à la suite d'une prise de sang, est l'examen de biologie médicale le plus réalisé en France. Cet examen se déroule en deux temps. Le premier temps, automatisé, permet de mesurer les différents paramètres de l’examen (hémoglobine, plaquettes…). Le deuxième temps consiste, selon les cas, à observer les cellules au microscope afin de compter et analyser les leucocytes (globules blancs), ce qui aide à orienter le diagnostic en hématologie biologique. 

La bonne reconnaissance des leucocytes normaux, réactionnels et pathologiques est délicate et nécessite l’expertise d’un spécialiste en cytologie aguerri. Actuellement, l’expertise est concentrée dans les centres de références. Un algorithme fiable pour la classification des cellules du sang serait particulièrement utile afin de proposer un diagnostic rapide et exact aux patients, peu importe leur localisation géographique.

Pour ce data challenge, les participants ont eu accès à une base de données inédite de près de 75 000 images de leucocytes normaux et pathologiques annotées. Ces images proviennent de la numérisation à fort grossissement de frottis sanguins issus de 23 centres hospitaliers francophones. 

L’objectif pour les compétiteurs a été de développer un modèle capable de distinguer automatiquement les leucocytes sanguins normaux des leucocytes pathologiques et de les classer selon l’une des 23 classes identifiées par un comité d’experts.

Validation

Non validé

Plus d’informations dans les dépôts GitHub associés.

Date de dernière mise à jour

Ces algorithmes ont été produits dans le cadre du data challenge Cytolog-IA clôturé le 6 janvier 2025.

Plus d’informations dans les dépôts GitHub associés.

Maintenance

Ad-hoc (en fonction des remontées de problèmes, suggestions)

Voir sur les dépôts GitHub associés. 

Comment installer l’algorithme ?

Voir sur les dépôts GitHub associés. 

Comment utiliser l’algorithme ?

Voir sur les dépôts GitHub associés. 

Contributions

Voir sur les dépôts GitHub associés. 

Crédits

Voir sur les dépôts GitHub associés. 

Licence et conditions d’utilisation

MIT