L’apprentissage automatique et les données climatiques offrent de nouvelles perspectives sur la prévision de la dengue

La dengue est une maladie transmise par les moustiques qui infecte environ 390 millions de personnes dans le monde chaque année. Le nombre de cas a augmenté régulièrement ces dernières années, les épidémies les plus graves se produisant dans les régions tropicales d’Amérique du Sud. Pour mieux prédire comment la maladie se propage, il sera essentiel que les chercheurs comprennent parfaitement comment le nombre de cas de dengue est lié aux différents aspects des climats tropicaux.

Grâce à une nouvelle analyse publiée dans Thèmes spéciaux du European Physical Journalune équipe dirigée par Enrique Gabrick de l’Institut de Potsdam pour l’impact climatique, en Allemagne, souligne comment les prévisions sur la dengue peuvent devenir plus précises en intégrant des données climatiques, mais montre également que le succès de cette approche peut varier selon les régions. Les résultats de l’équipe pourraient permettre aux chercheurs d’élaborer des prévisions plus précises sur la propagation de la dengue, ce qui pourrait à terme contribuer à sauver des milliers de vies.

À l’échelle mondiale, le nombre de personnes infectées par la dengue a montré une tendance inquiétante au cours des 20 dernières années, passant d’environ 500 000 cas en 2000 à 5,2 millions en 2019. « La plupart de ces cas ont été signalés dans les pays tropicaux, en particulier dans les Amériques.  » explique Gabrick. « Cette préférence géographique est motivée par les conditions environnementales et les facteurs climatiques, tels que la température, l’humidité et les précipitations, qui sont essentiels au cycle de vie des moustiques. »

En Amérique du Sud, les infections par la dengue se sont encore accélérées au cours de l’année écoulée, avec plus de 670 000 cas signalés au cours des cinq premières semaines de 2024. Afin que les interventions de santé publique puissent ralentir ce taux d’infection, il sera essentiel que les chercheurs construire des modèles prédictifs plus précis, qui intègrent toutes les variables ayant un impact mesurable sur le nombre de cas futurs.

Pour relever ce défi, l’équipe de Gabrick a appliqué une technique d’apprentissage automatique basée sur des algorithmes de « forêt aléatoire ». Cette méthode fonctionne en construisant de nombreux « arbres de décision » légèrement différents : chacun étant essentiellement un organigramme qui fait des interprétations indépendantes de nouvelles données, basées sur les données d’entraînement de l’algorithme.

« Nous avons choisi l’algorithme de forêt aléatoire en raison de sa robustesse et de sa capacité prédictive », explique Gabrick. « Il est basé sur une méthode d’apprentissage d’ensemble et se compose de plusieurs arbres de décision, permettant des prédictions plus précises que les modèles individuels. De plus, l’algorithme évalue l’importance des variables d’entrée, fournissant ainsi des informations précieuses sur les facteurs qui influencent les prévisions. »

Pour tester leur approche, l’équipe a entraîné son algorithme à l’aide de numéros de cas historiques de dengue provenant de trois villes différentes du Brésil, du Pérou et de la Colombie, chacune bénéficiant d’un climat tropical. Ils l’ont ensuite utilisé pour prévoir le nombre de cas de dengue une semaine à l’avance sur la base de trois considérations distinctes : les seuls cas de dengue actuels ; cas de dengue combinés à des données climatiques (notamment température, précipitations et humidité) ; et les cas de dengue combinés à l’humidité seule.

Étonnamment, chacune de ces considérations a donné la meilleure prédiction dans chacune des villes étudiées par l’équipe. Dans l’ensemble, les résultats ont révélé comment l’incorporation de variables climatiques conduit à des succès mitigés lors de la prévision du nombre de cas futurs et ne contribue pas toujours à améliorer les prévisions. Mais cela montre également qu’en réfléchissant soigneusement à la question de savoir s’il convient ou non de combiner le nombre de cas avec des données climatiques, uniquement des données sur l’humidité, ou ni l’une ni l’autre, les chercheurs pourraient à terme améliorer la précision de leurs prévisions.

« En outre, nous soulignons l’importance des techniques d’apprentissage automatique pour combiner les données météorologiques et épidémiologiques afin d’améliorer les prévisions », explique Gabrick. « Nous espérons que nos résultats auront un fort potentiel pour améliorer la prévision de la dengue et fournir des informations précieuses pour les interventions de santé publique. »