2024

PENELOPALGO

établissements & professionnels de santé
organismes de recherche
acteurs industriels
Partager

Partenaires 

  • L’AP-HP est le plus grand centre hospitalier universitaire d’Europe, regroupant 39 établissements et hébergeant plus de 14 millions de patients dans son Entrepôt de Données de Santé (EDS). L’AP-HP mène de nombreuses activités de recherche clinique et dispose d’un écosystème structuré en matière de gestion de données de santé, sécurité, et innovation numérique. 
  • Kereval est une PME française indépendante spécialisée dans les tests de logiciels créée en 2002. Kereval a investi dans le domaine des tests d'intelligence artificielle (IA) et a développé une expertise spécifique, y compris le développement de méthodes, de procédures et de bancs d'essai pour les tests d'IA. 
  • Le LIMICS (Laboratoire d’Informatique Médicale et d’Ingénierie des Connaissances en e-Santé) est une unité mixte de recherche rattachée à Sorbonne Université, l’Université Paris Nord et l’INSERM. Il est spécialisé dans les domaines de l’informatique médicale, de l’interopérabilité des systèmes de santé, du traitement automatique du langage naturel (TAL) et de l’extraction de données cliniques à partir des Dossiers Patients Informatisés. 

 

Contexte 

Un essai clinique est une étude scientifique réalisée chez l’être humain pour évaluer l’efficacité, la tolérance, la sécurité ou les effets secondaires d’un traitement, d’un médicament, d’un dispositif médical ou d’une méthode diagnostique ou préventive. 

Aujourd’hui, beaucoup d’essais cliniques peinent à recruter suffisamment de patients : seuls 50 % atteignent leurs objectifs, et moins de 30 % dans les délais prévus. Cela s’explique par plusieurs raisons : manque d’information pour les patients, craintes ou contraintes liées à leur participation, manque de temps pour les soignants, ou encore complexité des protocoles. Résultat : la validation de nouveaux traitements est retardée, et certains patients perdent l’accès à des innovations thérapeutiques.

Pour améliorer la situation, les Systèmes d’Aide au Recrutement dans les essais cliniques (SAREC), intégrant des algorithmes de ciblage basés sur les données des Dossiers Patients Informatisés (DPI), apparaissent comme une solution prometteuse. Mais ils restent peu utilisés, car les données et les critères d’éligibilité ne sont pas toujours adaptés, en particulier pour exploiter les informations “non structurées” comme les comptes rendus ou les images médicales.

 

Objectif du projet 

Le projet PENELOPALGO est porté par l’AP-HP, en partenariat avec le LIMICS et Kereval. Il  vise à développer et évaluer des algorithmes de ciblage innovants pour identifier les patients potentiellement éligibles à des essais cliniques, en s’appuyant sur des jeux de données hospitalières. Les cas d’usage se concentreront sur deux champs pathologiques majeurs en cancérologie, les cancers ORL, avec un focus sur la chirurgie de lésions très variées, et les cancers colorectaux, pour une dimension médicamenteuse et concentrée sur les biomarqueurs.  

L’objectif du projet est de favoriser le développement de SAREC plus performants, mieux évalués, et conformes aux exigences de confiance et de qualité propre au milieu hospitalier. Ce projet vise également à améliorer l’inclusion des patients dans les essais cliniques, à renforcer la confiance dans les outils d’IA en milieu clinique et à faciliter leur accès à l’innovation thérapeutique.

 

Méthodologie et caractère innovant 

Le projet PENELOPALGO s’appuie sur une méthodologie structurée, en trois volets principaux :

  1. Définition d’un jeu de données minimum à partir des données structurées et non structurées de l’entrepôt de données de santé de l’AP-HP.
  2. Développement d’algorithmes de traitement automatique du langage (TAL) pour extraire des variables cliniques clés, ainsi que d’outils de présélection de patients éligibles à des essais cliniques, en se concentrant sur les cancers ORL et colorectaux.
  3. Évaluation innovante grâce à un protocole intégrant des métriques classiques et des critères avancés d’IA de confiance (explicabilité, robustesse via tests métamorphiques, caractéristiques « FAIR » des données), testé en conditions réelles.

Le projet PENELOPALGO est lauréat de l’appel à manifestation d’intérêt visant à alimenter la Bibliothèque Ouverte d’Algorithmes en Santé (BOAS). Dans ce cadre, les porteurs bénéficient d’un appui méthodologique, technique, d’un soutien financier et d’un accompagnement dans l’ouverture des résultats.

 

Résultat / Livrable attendu

Le projet aboutira à la production d’algorithmes  mis à la disposition de la communauté scientifique en open source, et permettant l’extraction d’informations et le ciblage de patients éligibles aux essais cliniques. Il proposera également un protocole d’évaluation complet, combinant des métriques classiques et des indicateurs avancés, pouvant être réutilisés dans d’autres projets d’IA en santé. Enfin, une documentation détaillée (incluant le périmètre, les performances et les conditions d’usage) sera publiée en libre accès afin de faciliter la portabilité et la réutilisation des outils développés.

Chiffres clés

3000 essais cliniques
autorisés chaque année en France