Des chercheurs de l’Université de Pékin ont mené une étude systématique complète sur l’intégration de l’apprentissage automatique dans les méthodes statistiques pour les modèles de prévision des risques de maladie, mettant en lumière le potentiel de tels modèles intégrés dans les pratiques de diagnostic clinique et de dépistage. L’étude, dirigée par le professeur Feng Sun du Département d’épidémiologie et de biostatistique de l’École de santé publique de l’Université de Pékin, a été publiée dans Science des données de santé.
La prévision du risque de maladie est cruciale pour un diagnostic précoce et une prise de décision clinique efficace. Cependant, les modèles statistiques traditionnels, tels que la régression logistique et la régression à risques proportionnels de Cox, se heurtent souvent à des limites dues à des hypothèses sous-jacentes qui ne sont pas toujours valables dans la pratique.
Parallèlement, les méthodes d’apprentissage automatique, malgré leur flexibilité et leur capacité à gérer des données complexes et non structurées, n’ont pas toujours démontré des performances supérieures par rapport aux modèles traditionnels dans certains scénarios. Pour relever ces défis, l’intégration de l’apprentissage automatique aux méthodes statistiques traditionnelles peut offrir des modèles de prédiction plus robustes et plus précis.
L’examen systématique a analysé diverses stratégies d’intégration pour les modèles de classification et de régression, notamment le vote majoritaire, le vote pondéré, l’empilement et la sélection de modèles, selon que les prédictions des méthodes statistiques et de l’apprentissage automatique étaient en désaccord. L’étude a révélé que les modèles d’intégration surpassaient généralement les méthodes statistiques et d’apprentissage automatique lorsqu’ils étaient utilisés seuls. Par exemple, l’empilement s’est avéré particulièrement efficace pour les modèles impliquant plus de 100 prédicteurs, car il permet de combiner les points forts de différents modèles tout en minimisant les faiblesses.
« Nos résultats suggèrent que l’intégration de l’apprentissage automatique dans les méthodes statistiques traditionnelles peut fournir des modèles plus précis et généralisables pour la prévision des risques de maladie », a déclaré le professeur Feng Sun, chercheur principal. « Cette approche a le potentiel d’améliorer la prise de décision clinique et d’améliorer les résultats pour les patients. »
Pour l’avenir, l’équipe de recherche prévoit de valider et d’améliorer davantage les méthodes d’intégration existantes et de développer des outils complets pour évaluer ces modèles dans divers contextes cliniques. L’objectif ultime est d’établir des modèles d’intégration plus efficaces et généralisables, adaptés à différents scénarios, faisant ainsi progresser les pratiques de diagnostic clinique et de dépistage.
Fourni par Science des données sur la santé