Les chercheurs de Stanford Health Policy ont construit un modèle pour tester si l’IA pouvait gérer efficacement la propagation des maladies entre les prisons et les communautés environnantes. Les résultats furent décisifs.
Les maladies infectieuses peuvent se propager dans les établissements correctionnels à un rythme alarmant, avec des épidémies entrant et sortant des communautés environnantes et pouvant se propager davantage à des communautés plus éloignées.
Malgré ces liens, les communautés et les prisons coordonnent rarement leurs efforts pour contrôler les épidémies. Ainsi, les chercheurs de Stanford Health Policy ont mené une étude examinant différentes manières de mieux protéger les deux populations.
Les chercheurs ont construit un modèle informatique pour simuler la façon dont une maladie infectieuse se propage entre les communautés et les établissements correctionnels. Ils ont testé plusieurs façons de contrôler la propagation des maladies, notamment des politiques de contrôle standard basées sur des règles et des politiques plus récentes basées sur l’IA, développées à l’aide de l’apprentissage par renforcement (RL), une forme d’intelligence artificielle qui apprend par essais et erreurs.
La méthode RL utilisait un « système de récompense » qui équilibrait deux objectifs : prévenir les infections et minimiser les coûts des mesures de contrôle.
Les chercheurs ont découvert que la politique de contrôle RL basée sur l’IA fonctionnait nettement mieux que les approches traditionnelles comme celles utilisées pendant la pandémie de COVID-19.
Ils ont ensuite analysé le fonctionnement de la politique de contrôle la plus performante et sa fiabilité dans différentes conditions. Ils ont constaté qu’il adaptait sa réponse aux conditions uniques des communautés et des prisons et montrait des modèles qui contribuaient à réduire la propagation des maladies entre les deux. Par exemple, à mesure que la maladie se propageait à travers le réseau, la politique de contrôle de RL a concentré les ressources sur les tests dans les communautés et les prisons menacées d’épidémie, mais avant que les épidémies ne surviennent, afin qu’une détection précoce laisse plus de temps pour déployer des interventions supplémentaires.
« L’apprentissage par renforcement est une méthode prometteuse pour trouver des politiques efficaces permettant de contrôler la propagation de l’épidémie sur les réseaux de communautés et d’établissements correctionnels, fournissant des informations qui peuvent aider à orienter les politiques », a déclaré Christopher Weyant, Ph.D., chercheur postdoctoral récent du SHP et auteur principal de l’étude publiée dans Prise de décision médicale.
Des taux d’infection plus élevés
« Les établissements correctionnels, tels que les prisons et les prisons, ont historiquement eu des taux d’incidence de maladies infectieuses respiratoires considérablement plus élevés que les communautés environnantes », a déclaré Jeremy Goldhaber-Fiebert, Ph.D., professeur de politique de santé et auteur principal de l’étude.
Il a noté qu’au cours des premières phases de la pandémie, les prisonniers aux États-Unis avaient un taux d’incidence du COVID-19 plus de cinq fois supérieur à celui de la population générale – une tendance également observée avec d’autres maladies respiratoires comme la tuberculose et la grippe, et dans d’autres régions comme l’Amérique du Sud.
« De petites épidémies communautaires peuvent provoquer des épidémies plus importantes dans les établissements correctionnels, ce qui peut à son tour exacerber les épidémies communautaires », a déclaré Goldhaber-Fiebert. « Malgré cette interdépendance, les efforts de contrôle de l’épidémie dans les communautés et les établissements correctionnels ne sont généralement pas étroitement coordonnés. »
Les chercheurs ont construit un modèle de simulation d’une épidémie se propageant à travers les réseaux de communautés et d’établissements correctionnels. En utilisant à la fois un vaste réseau basé en Californie et un réseau illustratif plus petit, ils ont comparé les performances de diverses stratégies de contrôle, notamment les approches heuristiques et RL.
La stratégie RL a donné de bien meilleurs résultats que les autres approches du réseau californien. L’équipe a comparé plusieurs approches, telles que l’application de mesures de contrôle telles que les tests et les interventions non pharmaceutiques, comme le masquage et la distance sociale, à toutes les installations, à aucune, ou l’utilisation d’une méthode simple basée sur des règles ou d’une stratégie RL.
Ils ont constaté que la politique RL pourrait permettre d’obtenir des réductions des infections proches de celles d’une approche « contrôler tout », mais avec beaucoup moins de ressources utilisées pour les tests et des interventions non pharmaceutiques beaucoup moins intenses.
La ventilation des avantages et des coûts fournit des orientations aux décideurs politiques qui envisagent l’allocation des ressources entre les communautés et les prisons lors de futures épidémies. Des résultats similaires ont été observés avec le réseau illustratif.
Alors que les auteurs ont utilisé l’exemple récent et marquant des politiques de contrôle de la pandémie de COVID-19, leurs analyses de sensibilité ainsi que leurs travaux antérieurs démontrent que l’approche et les méthodes qu’ils ont développées sont utiles pour contrôler une gamme d’agents pathogènes respiratoires susceptibles de provoquer de futures pandémies.
« Notre travail met en évidence la manière dont le contrôle d’une épidémie sur un réseau de communautés et d’établissements correctionnels peut être amélioré de manière robuste grâce à l’utilisation de méthodes quantitatives modernes, telles que RL », a écrit l’équipe. « Les décideurs politiques devraient envisager d’investir dans le développement de telles méthodes et de les utiliser pour de futures épidémies. »