En utilisant des outils de Process Mining, les chercheurs de Mines Saint-Étienne s’attachent à décrire les parcours de soin typiques de patients atteints d’une pathologie donnée. À partir de ces modèles, ils peuvent aider les praticiens à prédire les prochaines étapes de traitement ou les évolutions d’une maladie.
Les médecins pourront-ils bientôt anticiper les complications de la maladie d’un patient ? Pourront-ils définir en avance toute une trajectoire de soin pour un patient atteint d’une pathologie particulière ? Ce sont en tout cas des objectifs que l’équipe de Vincent Augusto, à Mines Saint-Étienne, tente d’atteindre. « À partir de l’historique des soins d’un patient, de son état à un instant donné, et des parcours de soin de patients similaires, nous cherchons à prédire les prochaines étapes qui l’attendent » résume Hugo De Oliveira, doctorant en ingénierie des systèmes de soin et dont la thèse CIFRE est financée par la PME lyonnaise HEVA.
Anticiper les évolutions d’une maladie et les étapes de soin permet de limiter les risques auxquels sera exposé le patient. Dans le cas de personnes diabétiques — exemple utilisé par les chercheurs dans leurs travaux — la démarche consiste à détecter le plus tôt possible des signaux faibles précurseurs de complications. Pour un patient donné, l’analyse porte sur plusieurs années de l’historique de prise en charge et sur la comparaison avec d’autres patients diabétiques. Ainsi, il est possible de déterminer son risque de développer une insuffisance rénale ou de nécessiter une amputation liée au diabète.
Afin de prédire ces évolutions, les chercheurs ne s’appuient pas sur des données médicales personnelles, comme des radiographies ou des analyses biologiques. Ils utilisent les données médico-administratives du système national des données de santé (SNDS). « En 2006, la tarification à l’activité a été mise en place » rappelle Hugo De Oliveira. Avec cette modification du principe de financement des établissements de santé, une grande base de données a été créée pour permettre aux hôpitaux de disposer des informations nécessaires au remboursement des soins. « C’est une base très riche pour nous, poursuit le jeune chercheur, car chaque ligne rassemble des informations sur le séjour d’un patient : son âge, son sexe, sa prise en charge, le diagnostic principal, les pathologies associées dont il est atteint… ».
Tout un parcours en un graphe
L’équipe de Vincent Augusto met au point des algorithmes qui se chargent d’analyser ces grandes quantités de données. Les patients sont triés et regroupés par critères de similarité. Ainsi, des catégories de parcours de soin peuvent être établies, chacune rassemblant plusieurs milliers de parcours semblables (patients similaires, complications identiques…). Dans une catégorie — celle de patients diabétiques ayant subi une amputation par exemple — l’algorithme analyse toutes les étapes de tous les patients, pour en déduire les plus caractéristiques. Un graphe en est tiré, représentant le parcours typique d’un patient de cette catégorie. Il pourra alors être utilisé comme référence pour savoir si un patient en début de pathologie présente des étapes semblables, et ainsi déterminer les probabilités qu’il a d’appartenir à cette catégorie.
En procédant de la sorte, les chercheurs mettent au point des graphes longitudinaux : chaque étape de soin représente un point du graphe, et le tout se lit de manière chronologique. « Les praticiens peuvent lire le graphe très facilement, et repérer où se situe le patient dans la succession d’étapes qui caractérise son parcours » précise Hugo De Oliveira. La difficulté de ce type de représentation des données réside dans son exhaustivité : « Il faut arriver à rentrer sur une seule ligne tout le parcours du patient » problématise le doctorant. Afin d’y parvenir, l’équipe a choisi d’utiliser le process mining, un outil de fouille des données et d’extraction de connaissance — le machine learning en est un autre.
Si le process mining apporte plus d’efficacité et de lisibilité dans la description d’un parcours de soin, il présente également un autre avantage : celui de ne pas être une boîte noire. Cette caractéristique est souvent rencontrée dans les algorithmes de type réseau de neurones. Ceux-ci effectuent un traitement de qualité, mais il est impossible de comprendre les cheminements qui aboutissent aux résultats de l’algorithme. À l’inverse, les algorithmes de process mining utilisés dans le cas de la prédiction du parcours de soin sont transparents. « Lorsqu’un patient est caractérisé par un type de graphe, nous pouvons comprendre pourquoi grâce aux étapes du parcours passé, et étudier chaque graphe type de catégories de patient pour comprendre comment l’algorithme a évalué un parcours » assure Hugo De Oliveira.
Amener de la transparence dans les applications de l’intelligence artificielle est l’une des préoccupations mises en avant par le groupe de travail du rapport France IA piloté par Cédric Villani. Le projet s’inscrit également dans les objectifs fixés par le mathématicien et député de faciliter l’expérimentation de l’IA pour les applications, en santé notamment. « Nos travaux bénéficient directement des politiques d’ouverture d’accès aux données de santé » insiste le doctorant. Une ouverture qui va se poursuivre pour les chercheurs, puisqu’ils auront dès cette année la possibilité d’utiliser la base de données du système national inter-régimes d’assurance maladie (SNIIRAM) : 1,2 milliards de feuilles de soin seront alors exploitables pour améliorer les algorithmes, et mieux cerner les parcours de soin des patients.
5 comments
Pingback: Vincent Augusto - I'MTech
Pingback: Mieux organiser l'hôpital grâce à la simulation numérique - I'MTech
Pingback: Top 5 de nos articles 2018 sur I'MTech - I'MTech
Pingback: À Saint-Étienne, l'école des Mines planche sur la médecine du futur
Pingback: Parler le langage des données de santé pour mieux les exploiter - I'MTech