Un outil d’apprentissage automatique peut aider à diagnostiquer, surveiller le cancer colorectal

Les scientifiques visant à faire progresser les diagnostics de cancer ont développé un outil d’apprentissage automatique capable d’identifier les différences de profil moléculaire liées au métabolisme entre les patients atteints de cancer colorectal et les personnes en bonne santé.

L’analyse des échantillons biologiques de plus de 1 000 personnes a également révélé des changements métaboliques associés à l’évolution de la gravité de la maladie et aux mutations génétiques connues pour augmenter le risque de cancer colorectal.

L’œuvre est publiée dans la revue iMetaomics.

Bien qu’il y ait plus d’analyse à venir, le « pipeline de découverte de biomarqueurs » qui en résulte est prometteur en tant que méthode non invasive pour diagnostiquer le cancer colorectal et surveiller la progression de la maladie, a déclaré le Jiangjiang Zhu, auteur co-sénior de l’étude et professeur agrégé de sciences humaines à l’Ohio State University.

« Nous pensons qu’il s’agit d’un bon outil pour les diagnostics et la surveillance de la maladie, en particulier parce que l’analyse des biomarqueurs basée sur le métabolique pourrait également être utilisée pour surveiller l’efficacité du traitement », a déclaré Zhu, également chercheur du programme de recherche sur la carcinogenèse et la chimioprévention du centre de cancer de l’Ohio State University.

« Lorsqu’un patient prend un médicament contre le médicament B, en particulier pour le cancer, le temps est essentiel. S’il n’a pas une bonne réponse, nous voulons savoir que dès que possible, nous pouvons changer le régime de traitement. Si les métabolites peuvent aider à indiquer l’efficacité d’un traitement plus rapide que les méthodes traditionnelles comme la pathologie ou les marqueurs de protéines, nous espérons être de bons indicateurs pour les médecins qui ne se soucient pas des patients. »

L’outil n’est pas destiné à remplacer la coloscopie comme l’étalon-or pour le dépistage du cancer, a déclaré ZHU, et une étude plus approfondie avec des échantillons supplémentaires est prévue avant que le pipeline ne soit prêt pour la traduction dans un cadre clinique.

Ce travail représente également une avancée dans les techniques d’apprentissage automatique, combinant deux méthodes établies pour concevoir la nouvelle plate-forme: une analyse partielle des moindres carrés-discriminants (PLS-DA) pour la différenciation à grosse image des profils moléculaires, et un réseau neuronal artificiel (ANN) qui, dans ce cas -, les molécules de pointe qui améliorent la valeur prédictive de la plate-forme. L’équipe a appelé le biomarqueur qui en résulte Panda, abréviation de PLS-Ann-da.

« Nous avons pris le meilleur parti des deux mondes et les avons mis ensemble pour tirer parti de leurs forces et nous compléter pour compenser leurs faiblesses potentielles », a déclaré Zhu. « Nous examinions toutes sortes de possibilités de démêler les biomarqueurs qui pourraient être prédictifs ou indicatifs de la progression de la maladie et des différentes étapes de la maladie. Cela nous a donné une forte confiance que cette méthode a un grand potentiel pour les diagnostics futurs. »

Deux ensembles de données biologiques extraits d’échantillons de sang ont été analysés: métabolites, produits de réactions biochimiques qui décomposent les aliments pour produire de l’énergie et remplissent d’autres fonctions essentielles et les transcrits, les lectures d’ARN des instructions d’ADN qui prédisent les changements de protéines connexes.

Les échantillons biologiques sont une partie importante de la force de l’étude, a déclaré Zhu, car ils ont été collectés dans le cadre de grands projets de recherche: l’Ohio Colorectal Cancer Prevention Initiative (OCPI) et une Biobank de l’Ohio State Wexner Medical Center Clinical Laborator. Au total, 626 échantillons provenaient de personnes atteintes d’un cancer colorectal, y compris des patients présentant des mutations génétiques à haut risque. 402 autres échantillons d’individus en bonne santé par âge et entre les sexes ont été obtenus par Jieli Li, auteur de l’étude co-ennior et professeur agrégé de pathologie clinique au Collège de médecine de l’Ohio State.

« Nous, en tant qu’humains, à différentes étapes de notre vie, nous avons en fait une biochimie assez différente », a déclaré Zhu. «Cette précieuse collection d’échantillons nous a permis de diffuser une analyse métabolomique à haut débit pour comprendre les changements moléculaires des personnes qui n’ont pas de cancer à des personnes qui ont un cancer, ainsi que de la maladie à un stade supérieur au stade tardif.

« Nous avons également des données de patients atteints de mutations génétiques que nous pouvons comparer aux données métabolites pour examiner si les changements métaboliques sont une indication de valeurs prédictives pour les mutations génétiques. À notre connaissance, c’est la première fois que cela est fait à cette portée et à cette échelle parce que nous regardons littéralement des centaines de patients. »

Les biomarqueurs sont difficiles à compter pour les diagnostics dans différentes populations en raison des nombreuses conditions qui affectent les profils moléculaires dans les systèmes vivants – de sorte que cette étude met en évidence plusieurs changements moléculaires avec le potentiel, mais pas la certitude, dans l’évaluation de la présence et de la progression du cancer colorectal dans un groupe de patients représentatifs nationaux.

Les voies de métabolisme liées à une famille de composés appelés purines, qui sont nécessaires pour la formation et la dégradation de l’ADN, se sont démarquées dans l’analyse car elles étaient globalement plus actives chez les patients cancéreux par rapport aux témoins sains et étaient moins actifs dans les stades tumoraux plus avancés.

« C’est certainement une indication que ce biomarqueur peut être associé aux mécanismes sous-jacents de la biologie du cancer », a déclaré Zhu. « Nous sommes prudemment optimistes en disant que nous faisons non seulement une découverte de biomarqueurs, mais que nous fournissons également des indices pour les enquêtes mécanistes. »

L’équipe prévoit de continuer à analyser les métabolites liés à différents types de signaux biologiques pour affiner le pipeline Panda Biomarker.

« Certains des marqueurs que nous avons identifiés sont un peu capricieux, et il y a beaucoup de bruit au sein de ces signaux, mais nous avons poussé le champ vers l’avant pour développer des biomarqueurs potentiels de nouvelle génération et le nouveau pipeline bioinformatique pour le diagnostic et la surveillance du cancer colorectal », a déclaré Zhu.

Les co-auteurs supplémentaires incluent le premier auteur Rui Xu, Hyein Jung, Fouad Choueiry, Shizi Zhang, Rachel Pearlman et Ning Jin, tous de l’Ohio State; et Heather Hampel du City of Hope National Cancer Center.