Être capable de prédire instantanément et avec précision la trajectoire de la santé d’une personne dans les années à venir a longtemps été considéré comme le summum de la médecine. Ce type d’informations aurait un effet profond sur les systèmes de soins de santé dans son ensemble – passer des soins du traitement à la prévention.
Selon les résultats d’un article récemment publié, les chercheurs en sont prometteurs. En utilisant la technologie de pointe de l’intelligence artificielle (IA), les chercheurs ont construit Delphi-2M. Cet outil cherche à prédire le prochain événement de santé d’une personne et quand cela se produira probablement au cours des 20 prochaines années. Le modèle le fait pour mille maladies différentes, notamment le cancer, le diabète et les maladies cardiaques.
Pour développer Delphi-2M, l’équipe de recherche européenne a utilisé des données de près de 403 000 personnes de la biobanque britannique comme contribution dans le modèle d’IA.
Dans le modèle final d’IA formé, Delphi-2M a prédit la maladie suivante et quand elle se produirait sur la base des relations sexuelles d’une personne à la naissance, de son indice de masse corporelle, qu’ils fumaient ou buvaient de l’alcool, et leur calendrier des maladies antérieures.
Il a pu faire ces prédictions avec 0,7 AUC (zone sous la courbe). L’AUC agrége les taux de faux positifs et de faux négatifs, il peut donc être utilisé comme indicateur indirect de la précision dans un contexte théorique. Cela signifie que les prédictions du modèle pourraient être interprétées comme ayant une précision d’environ 70% dans toutes les catégories de maladies – bien que la précision de ces prédictions n’ait pas encore été testée en termes de résultats réels.
Les chercheurs ont ensuite appliqué le modèle aux données danoises biobanques pour voir si elles étaient toujours efficaces. Il a pu prédire les résultats pour la santé avec des taux de précision théorique similaires.
Outils d’IA
Le but du journal n’était pas de suggérer que le Delphi-2M est prêt à être utilisé par les médecins ou dans le domaine médical. Il s’agissait plutôt d’illustrer la puissance de l’architecture d’IA proposée par l’équipe et l’avantage qu’il pourrait avoir pour analyser les données médicales.
Delphi-2M utilise un « réseau de transformateur » pour faire ses prédictions. Il s’agit de la même architecture technologique qui alimente Chatgpt. Les chercheurs ont modifié l’architecture du transformateur GPT2 pour utiliser le temps et les caractéristiques de la maladie pour prédire quand et ce qui se passera.
Bien que d’autres modèles de prédiction pour la santé aient utilisé des réseaux de transformateurs dans le passé, ceux-ci ont été conçus uniquement pour faire des prédictions sur le risque d’une personne de développer une seule maladie. De plus, ils étaient principalement utilisés sur les données d’enregistrement des hôpitaux à plus petite échelle.
Mais les réseaux de transformateurs sont particulièrement bien adaptés pour prédire le risque d’une personne de maladies multiples. En effet, ils peuvent s’adapter facilement à leur attention et sont capables d’élaborer des interactions complexes entre de nombreuses maladies différentes de plusieurs points de données distincts.
Delphi-2M s’est également avéré légèrement plus précis que les autres modèles de prédiction multi-maladies qui utilisent une architecture différente.
Par exemple, Milton a utilisé une combinaison de techniques d’apprentissage automatique standard et les a appliqués aux mêmes données britanniques biobanques. Ce modèle a montré une puissance prédictive un peu plus faible pour la plupart des maladies par rapport à Delphi-2M – et a besoin d’utiliser plus de données pour le faire.
De plus, les modèles non transformateurs sont difficiles à améliorer pour les autres en ajoutant plus de couches de données. Cela signifie que ces modèles ne peuvent pas être aussi facilement adaptés et améliorés comme modèles de transformateurs à utiliser dans différents contextes et études.
Ce qui est spécial dans le modèle Delphi-2M, c’est qu’il peut être libéré au public en tant que modèle open source sans compromettre la vie privée des patients. Les auteurs ont pu créer des données synthétiques qui imitent les données britanniques biobanques tout en supprimant des informations personnellement identifiables, tout sans une baisse significative du pouvoir prédictif. De plus, Delphi-2M nécessite moins de ressources informatiques pour s’entraîner que les modèles de transformateurs AI typiques.
Cela permettra à d’autres chercheurs de former le modèle à partir de zéro et éventuellement d’adapter le modèle et les informations de leurs besoins. Ceci est important pour l’avancement de la science ouverte et est généralement difficile à faire en milieu médical.
Encore trop tôt
Que Delphi-2M devienne ou non le modèle de fondation pour les outils d’IA qui sont conçus pour prédire les risques futurs pour la santé d’un patient, il démontre que des modèles comme celui-ci sont en cours.
En raison de son architecture en couches et de sa nature open source, les futurs modèles similaires à Delphi-2M continueront d’évoluer en incorporant des données encore plus riches, telles que les dossiers de santé électroniques, les images médicales, les technologies portables et les données de localisation. Cela améliorerait ses pouvoirs prédictifs et sa précision au fil du temps.
Mais bien que la capacité de prévenir les maladies et de fournir un diagnostic précoce est très prometteuse, il y a quelques mises en garde clés en ce qui concerne cet outil prédictif.
Premièrement, il existe de nombreuses préoccupations liées aux données associées à ces outils. Comme nous l’avons écrit auparavant, la qualité des données et de la formation qu’un outil d’IA reçoit fait ou brise ses prédictions.
L’ensemble de données britannique biobanque utilisé pour créer Delphi-2M n’avait pas suffisamment de données sur diverses races et groupes ethniques pour permettre une formation approfondie et une analyse des performances.
Bien que certaines analyses aient été réalisées par les chercheurs de Delphi-2M pour montrer que l’ajout de l’ethnicité et de la race n’a pas trop influencé les résultats, il y avait encore des données insuffisantes dans de nombreuses catégories pour même effectuer l’évaluation.
S’ils sont utilisés dans le monde réel, les données de soins de santé personnelles seront probablement utilisées et superposées au-dessus des modèles de fondation tels que Delphi-2M. Bien que l’inclusion de ces données personnelles améliorera la précision de la prédiction, elle comporte également des risques – par exemple, autour de la sécurité des données personnelles et de l’utilisation hors contexte des données.
Il peut également être difficile de faire évoluer le modèle aux pays dont les systèmes de soins de santé diffèrent de ceux qui sont utilisés pour concevoir l’ensemble de données. Par exemple, il peut être plus difficile d’appliquer Delphi-2M au contexte américain, où les données sur les soins de santé sont réparties autour de plusieurs systèmes hospitaliers et des cliniques privées.
À l’heure actuelle, il est trop tôt pour que Delphi-2M soit utilisé par les patients ou les médecins. Bien que Delphi-2M ait fourni des prédictions généralisées en fonction des données utilisées pour la former, il est trop tôt pour utiliser ces prédictions pour des recommandations de santé personnalisées pour un patient individuel.
Mais avec un peu de chance, avec l’investissement continu dans la recherche et la construction de modèles de style Delphi-2m, il sera un jour possible de saisir les données de santé personnelles d’un patient dans le modèle et d’obtenir une prédiction personnalisée.