Candidater
Comprendre le monde,
éclairer l’avenir

IA & Numérique

Dossier | Dauphine Digital Days 2022 "IA & société" - Les actes #1

Des algorithmes d'apprentissage automatique qui aident les médecins à prendre de meilleures décisions

3 mn - Le 27 novembre 2023

La mission de ce chercheur et entrepreneur : permettre aux chercheurs d’accéder à des bases de données de santé dédiées, afin qu’elles puissent profiter au plus grand nombre.

Ziad Obermeyer, enseignant-chercheur à Berkeley School of Public Health, fondateur de Dandelion et de Nightingale Open Source

La médecine semble coincée dans un monde d’il y a trente ou quarante ans. Le principal problème : l’accès à la donnée. Je l’ai constaté dans mes différents projets.

Des millions de personnes vont voir leur médecin, réalisent un électrocardiogramme, font un examen de santé, chaque année. Or, une partie d’entre elles ne reviendra pas l’année suivante, car elles mourront d’un arrêt cardiaque soudain. Les années 1980 et 1990 ont été synonymes de progrès, avec l’arrivée de défibrillateurs cardiaques sur le marché, pouvant être implantés pour redémarrer le cœur en cas d’arrêt. Le problème est que l’on ne peut le faire à tout le monde, cela ferait même plus de mal que de bien. En revanche, si l’on savait qui pourrait développer ce type de problème, ces appareils auraient une valeur ajoutée très forte…

Grâce à des données obtenues en Suède, croisant des électrocardiogrammes sur dix ans et des certificats de décès, et à du machine learning, nous avons cherché à prédire le risque d’arrêt cardiaque. Si vous êtes une personne ayant un niveau de risque élevé d’arrêt cardiaque, nous serions confiants de vous conseiller l’option du défibrillateur. Vous aurez alors un risque de décès moitié moins important. À l’inverse, les personnes jugées « low-risk » voient la tendance s’inverser, et mieux vaut éviter de leur implanter l’appareil. La limite : ces données ne peuvent être généralisées. Nous avons aussi travaillé sur des données taïwanaises, afin d’effectuer des comparaisons.

Un meilleur accès aux données

Pour ces recherches, il a fallu accéder à des données de santé. Et cela n’a pas été simple. Afin d’obtenir ces fameux éléments suédois, les discussions ont démarré en 2015. Après un an d’échanges, un premier accord a été obtenu, puis un second encore deux ans plus tard pour les certificats de décès. Il a fallu encore une année pour récupérer les électrocardiogrammes. Les conditions d’utilisation des données peuvent être aussi compliquées. Un assistant avait accès aux données, mais avec une latence systématique du serveur d’une à deux secondes. C’était très frustrant. Il a fallu aussi compter une année pour construire notre modèle.

Dans ce cadre, j’ai décidé de fonder une ONG, pour permettre aux chercheurs d’obtenir un meilleur accès à ces fameuses données de santé. Beaucoup de doctorants de Berkeley m’ont contacté, car ils ont envie de travailler sur un sujet valorisant, utile, comme la santé. Sauf que le temps qu’ils aient accès aux données, ils finissent par se décourager. Il faut le simplifier. Au risque de voir filer les talents.

Le cauchemar de la fuite

Alors, pourquoi est-ce aussi difficile ? Déjà, parce que ceux qui disposent des données n’ont pas vraiment d’intérêt à les partager. Au contraire, ils voient surtout les risques.

La plateforme Nightingale Open Science a été créée dans cette optique : pour rendre des données accessibles et gratuites aux chercheurs qui les demandent. Elles sont standardisées, sous la forme d’images notamment, et suffisantes pour être utilisables dans le cadre du machine learning. Ce sont par exemple des visuels de biopsies, d’électrocardiogrammes. Là, les enseignants et les chercheurs y ont accès très rapidement, en quelques jours, ils doivent simplement s’inscrire et s’engager à ne les utiliser que dans le cadre de la recherche.

Ces données ont beaucoup de valeur pour la société. Ce sont nos données, de façon collective. Elles doivent donc bénéficier à tous, être utiles aux patients. Objectif : disposer de données variées, avec une diversité de géographies, de populations, de soins et de modèles économiques, notamment aux États-Unis. Pour ensuite les utiliser à bon escient.