Prédire les ressources d’un hôpital et ses urgences: interview d’Hugo Flayac, Head of research pour Calyps

Suite au dernier épisode d’Airccelerate podcast abordant le projet d’intelligence artificielle CalAI avec Tony Germini, directeur de la société Calyps, l’association LaData a eu la chance d’interviewer Hugo Flayac, directeur de recherche, sur la genèse du projet.

Portrait d’Hugo Flayac

Monsieur Flayac est d’abord docteur en physique quantique: après plusieurs années de recherche fondamentale à l’EPFL, il s’aperçoit que l’analyse de données et l’intelligence artificielle (IA) occupent toujours plus de place dans la profession. Il s’intéresse à l’IA et se forme auprès des experts de deeplearning.ai, alors qu’en 2018 la HEIG-VD ouvre un poste pour un projet Innosuisse regroupant deux de ses passions: IA et activité médicale. Il saute sur l’occasion et prend la tête du projet de recherche. Prévu sur une durée de 18 mois et lancé en partenariat avec la société valaisanne Calyps, ce dernier a pour objectif d’optimiser les flux ambulatoires d’un hôpital grâce aux techniques de machine learning. La prédiction d’indicateurs-clés comme les no-shows (patients, voire praticiens, ne se présentant pas à l’opération planifiée), la durée des opérations ainsi que de la probabilité de décès du patient font de cette première étape une réussite. Dès 2019, Hugo est engagé à plein temps chez Calyps et dirige la recherche pour l’entreprise.

L’engorgement des urgences en France

Comme le nom l’indique, les urgences sont difficiles à prévoir. Elles ne sont pas régulières et requièrent des adaptations aussi fréquentes qu’imprévues de personnel, ou de matériel. Sachant qu’un tiers des visiteurs arrivant aux urgences seront hospitalisés, anticiper les flux de personnes – patients, patients de 65+ ans, personnel soignant – serait un must.

Des premiers échanges entre Rodolphe Bourret, directeur général du Centre Hospitalier de Valenciennes (CHV), et Tony Germini à la conférence HIT 2019, aux longues discussions entre Calyps et les employés du CHV, tous tendent à la même conclusion: l’engorgement des urgences en France est un problème qui coûte cher, en temps comme en argent.

Du problème à la solution

Initiée en Suisse romande, la première étape de prototypage a impliqué l’Ensemble Hospitalier de la Côte (EHC) qui a fourni un volume important de données en lien avec la planification des opérations hospitalières. Après des résultats probants sur les opérations ambulatoires, l’attention a été portée sur les urgences du CHV: une collaboration se met rapidement en place entre l’équipe du Dr. Maisonneuve, le service informatique de l’hôpital et les experts en données de Calyps. Les données des patients sont stockées dans le data center du CHV, ces dernières étant anonymisées et transférées une fois par heure chez Calyps.

Le CHV est un grand centre hospitalier de 1850 lits qui compte environ 200 admissions aux urgences par jour. C’est grâce à cet important volume d’entrées statistiques qu’il a été possible de calculer des prédictions avec une faible marge d’erreur.

Ces données vont permettre à l’agence valaisanne de construire des modèles de machine learning permettant de prédire le nombre de personnes qui vont être admises aux urgences du CHV, jusqu’à 7 jours dans le futur. De 85% de réussite lors des premières versions, ces modèles sont parvenus à des prédictions atteignant un taux de fiabilité dépassant 90% après réglages. Avec les données qui arrivent chaque heure, le modèle peut apprendre en continu (cf. reinforcement learning expliqué dans l’interview de Karim Bensaci, directeur produits & solutions chez Calyps) et s’améliorer au fil du temps. 

La mécanique du système

Contrairement ce que l’on pourrait penser, le système n’est pas une boîte noire, mais plutôt une suite de plusieurs modules où chacun fait sa part. Un module estimera le temps durant lequel le patient restera aux urgences, un autre prédira si le patient sera intégré à un autre service de l’hôpital ou s’il pourra quitter le CHV, etc. D’autres modèles calculeront le nombre de personnes admises aux urgences chaque jour, combien vont en sortir, ou encore la “tension”, c’est-à-dire le nombre de patients dans un service à un instant donné. Les données utilisées par le système sont de trois types: 

  1. les données spécifiques à un patient tels que l’âge, le poids, la taille, le diagnostic effectué à son arrivée, ses constantes vitales et plus encore
  2. les données volumétriques qui sont elles des séries temporelles indiquant, par exemple, le nombre de patients heure par heure aux urgences
  3. les données environnementales telles que les prévisions météorologiques autour du centre ou les événements majeurs dans la région

Au sujet des données environnementales, deux anecdotes méritent d’être soulignées:

  • les média sociaux n’ont pas eu d’impact significatif sur les prédictions données par CalAI, car peu utilisés à Valenciennes (ca. 45’000 habitants) et ses environs (aire urbaine inférieure à 400’000 habitants).
  • les rencontres jouées par le Valenciennes Football Club peuvent rassembler plus de 20’000 spectateurs au Stade du Hainaut. Chaque match amène son lot de blessés, dont cinq à dix arrivent aux urgences du CHV, de mémoire de médecin (!)

Pour les données spécifiques aux patients, les technologies utilisées pour les prédictions sont des réseaux de neurone standard dits “à propagation avant”, aussi appelés feedforward neural networks, ou fully-connected neural networks en anglais. Alors que pour les données volumétriques, il a fallu utiliser un autre type de réseau afin de prendre en compte la saisonnalité des données (i.e. il y a plus de monde le lundi que le reste de la semaine, un pic d’admission se fait ressentir entre 14h et 15h, les motifs des semaines se répètent, les motifs des saisons se répètent, etc.). Pour résoudre ce problème, Calyps utilise des réseaux neuronaux convolutifs, ou “CNN” pour convolutional neural networks. Ce type de réseau est inspiré du cortex visuel des animaux et a fait ses preuves dans l’analyse d’images ces dernières années.

COVID-19, la kryptonite des modèles d’IA 

Les algorithmes d’intelligence artificielle apprennent sur des données passées afin de “prédire” le futur. Plus il y a de données, plus le système a l’occasion de généraliser et trouver les règles implicites du monde dans lequel il joue. Un événement inattendu comme la pandémie actuelle a mis à mal le système CalAI qui n’avait jamais vu ça avant, et c’est compréhensible. “Le COVID-19, c’est la kryptonite des modèles d’IA !”, dit Hugo. Par contre le système peut désormais apprendre des données actuelles afin de prédire une crise future, jusqu’à un certain point. Au moment de poser la question fatidique à Hugo Flayac “Est-ce que l’IA peut prédire le futur ?”, sa réponse est catégorique : “En l’état actuel, notre IA prédit à partir des motifs du passé”. Et c’est justement un sujet de discussion au goût du jour chez les chercheurs experts en IA dans le monde.

La suite

Le système CalAI fait actuellement ses preuves au sein du CHV. Il pourrait être utilisé par d’autres grands centres hospitaliers en France ou en Suisse, dans le futur. La problématique de l’engorgement des urgences semble être généralisée en France, CalAI pourrait donc aider d’autres institutions dans l’hexagone. La problématique semble moins critique actuellement en Suisse, même si cette solution innovante suscite déjà l’intérêt d’hôpitaux ou de cliniques. Pour ces dernières, la planification des opérations ambulatoires est plus pertinente et d’autres pistes restent à explorer : par exemple, la codification médicale nécessaire à la facturation d’une opération pourrait bénéficier d’un codage automatique par CalAI. Autant de pain sur la planche de Monsieur Flayac. 

Un article co-écrit par Jacky Casas et Marco Brienza.