Le modèle d’IA prévoit le risque de maladie des décennies à l’avance

Les chercheurs ont développé un modèle d’IA génératif qui utilise des dossiers de santé à grande échelle pour estimer comment la santé humaine peut changer avec le temps. Il peut prévoir le risque et le calendrier de plus de 1 000 maladies et prédire les résultats pour la santé plus d’une décennie à l’avance.

Ce nouveau modèle d’IA génératif a été construit sur mesure à l’aide de concepts algorithmiques similaires à ceux utilisés dans les modèles de grand langage (LLM). Il a été formé sur les données anonymisées des patients de 400 000 participants de la biobanque britannique.

Les chercheurs ont également testé avec succès le modèle en utilisant des données de 1,9 million de patients dans le registre national danois des patients. Cette approche est l’une des démonstrations les plus complètes à ce jour de la façon dont l’IA générative peut modéliser la progression de la maladie humaine à grande échelle et a été testée sur les données de deux systèmes de soins de santé entièrement séparés.

« Notre modèle d’IA est une preuve de concept, montrant qu’il est possible pour l’IA d’apprendre bon nombre de nos modèles de santé à long terme et d’utiliser ces informations pour générer des prédictions significatives », a déclaré Ewan Birney, directeur exécutif par intérim du European Molecular Biology Laboratory (EMBL).

« En modélisant comment les maladies se développent au fil du temps, nous pouvons commencer à explorer lorsque certains risques émergent et comment planifier au mieux les interventions précoces. C’est un grand pas vers des approches plus personnalisées et préventives des soins de santé. »

Cette œuvre, publiée dans la revue Natureétait une collaboration entre EMBL, le German Cancer Research Center (DKFZ) et l’Université de Copenhague.

IA pour les prévisions de santé

Tout comme les modèles de langage importants peuvent apprendre la structure des phrases, ce modèle d’IA apprend la «grammaire» des données de santé pour modéliser les antécédents médicaux alors que les séquences d’événements se déroulent au fil du temps. Ces événements comprennent des diagnostics médicaux ou des facteurs de style de vie tels que le tabagisme. Le modèle apprend à prévoir le risque de maladie à partir de l’ordre dans lequel de tels événements se produisent et combien de temps passe entre ces événements.

« Les événements médicaux suivent souvent des schémas prévisibles », a déclaré Tom Fitzgerald, scientifique du personnel de l’Institut européen de bioinformatique d’Embl’s (EMBL-EBI).

« Notre modèle d’IA apprend ces modèles et peut prévoir les résultats futurs de la santé. Il nous donne un moyen d’explorer ce qui pourrait arriver en fonction des antécédents médicaux d’une personne et d’autres facteurs clés. Surtout, ce n’est pas une certitude, mais une estimation des risques potentiels. »

Le modèle fonctionne particulièrement bien pour les conditions avec des schémas de progression clairs et cohérents, tels que certains types de cancer, les crises cardiaques et la septicémie, qui est un type d’intoxication sanguine. Cependant, le modèle est moins fiable pour des conditions plus variables, telles que les troubles de santé mentale ou les complications liées à la grossesse qui dépendent d’événements de vie imprévisibles.

Utilisation et limitations futures

Comme les prévisions météorologiques, ce nouveau modèle d’IA fournit des probabilités, pas des certitudes. Il ne prédit pas exactement ce qui arrivera à un individu, mais il offre des estimations bien calibrées de la probabilité que certaines conditions se produisent sur une période donnée. Par exemple, il pourrait prédire les chances de développer une maladie cardiaque au cours de la prochaine année.

Ces risques sont exprimés en taux au fil du temps, similaires à la prévision de 70% de chances de pluie demain. Généralement, les prévisions sur une période plus courte ont une précision plus élevée que celles à longue portée.

Par exemple, le modèle prédit différents niveaux de risque de crises cardiaques. Prenant la cohorte britannique de la biobanque à l’âge de 60 à 65 ans, le risque de crise cardiaque varie d’un risque de quatre sur 10 000 par an pour certains hommes à environ un sur 100 chez d’autres hommes, selon leurs diagnostics antérieurs et leur style de vie. Les femmes présentent un risque plus faible en moyenne, mais une propagation similaire de risque.

De plus, les risques augmentent en moyenne, à mesure que les gens vieillissent. Une évaluation systématique des données de la biobanque britannique non utilisée pour la formation a montré que ces risques calculés correspondent bien au nombre observé de cas entre les groupes d’âge et de sexe.

Le modèle est calibré pour produire des estimations précises de risques au niveau de la population, prévoyant la fréquence à laquelle certaines conditions se produisent au sein des groupes de personnes.

Cependant, comme tout modèle d’IA, il a des limites. Par exemple, parce que les données de formation du modèle de la biobanque britannique proviennent principalement de personnes âgées de 40 à 60 ans, les événements de la santé de l’enfance et des adolescents sont sous-représentés. Le modèle contient également des biais démographiques dus aux lacunes dans les données de formation, notamment la sous-représentation de certains groupes ethniques.

Bien que le modèle ne soit pas prêt à usage clinique, il pourrait déjà aider les chercheurs:

  • comprendre comment les maladies se développent et progressent avec le temps,
  • Explorez comment le mode de vie et les maladies passées affectent le risque de maladie à long terme,
  • Simuler les résultats pour la santé à l’aide des données artificielles des patients, dans des situations où les données du monde réel sont difficiles à obtenir ou à accéder.

À l’avenir, des outils d’IA similaires formés à des ensembles de données plus représentatifs pourraient aider les cliniciens à identifier tôt les patients à haut risque. Avec le vieillissement des populations et l’augmentation des taux de maladie chronique, être en mesure de prévoir les besoins de santé futurs pourrait aider les systèmes de soins de santé à mieux planifier et à répartir les ressources plus efficacement. Mais beaucoup plus de tests de test, de consultation et de réglementations robustes sont nécessaires avant que les modèles d’IA puissent être déployés en milieu clinique.

« C’est le début d’une nouvelle façon de comprendre la santé humaine et la progression de la maladie », a déclaré Moritz Gerstung, chef de la division de l’IA en oncologie à DKFZ et ancien chef de groupe chez Embl-Ebi.

« Des modèles génératifs tels que les nôtres pourraient un jour aider à personnaliser les soins et à anticiper les besoins en soins de santé.

Ce modèle d’IA a été formé à l’aide de données de santé anonymisées sous des règles éthiques strictes. Les participants au Royaume-Uni Biobank ont ​​donné leur consentement éclairé et les données danoises ont été accessibles conformément aux réglementations nationales qui exigent que les données restent au Danemark.

Les chercheurs ont utilisé des systèmes virtuels sécurisés pour analyser les données sans les déplacer à travers les frontières. Ces garanties aident à garantir que les modèles d’IA sont développés et utilisés de manière à respecter la confidentialité et à respecter les normes éthiques.