Les deux principales approches pour découvrir les gènes des maladies révèlent des aspects distincts de la biologie, selon une nouvelle étude. Bien que les deux méthodes soient largement utilisées, la recherche a révélé qu’elles identifient différents gènes ayant des implications majeures pour le développement de médicaments.
Publié dans Naturel’étude porte sur le génome humain, qui contient des milliers de gènes qui fournissent des instructions pour la fabrication des protéines, ainsi que de l’ADN régulateur qui contrôle le moment où les gènes s’activent.
La nouvelle enquête adopte une vision à l’échelle du génome de la façon dont de petites différences d’ADN – appelées variantes – peuvent influencer des caractéristiques telles que la taille, la couleur des cheveux et le risque de maladie.
Dirigés par des chercheurs de NYU Langone Health, de l’Université de Stanford, de l’UC San Francisco et de l’Université de Tokyo, les nouveaux travaux ont analysé deux méthodes principales utilisées pour déterminer comment les différences génétiques influencent la biologie des maladies.
Il s’agit d’études d’association pangénomique (GWAS), qui testent les variantes communes du génome (dans les gènes et les régions régulatrices) pour trouver celles liées à la maladie, et de tests de charge, qui se concentrent sur des variantes rares qui modifient les protéines.
En analysant les résultats du GWAS et des tests de charge pour 209 traits de la biobanque britannique, qui contient des données génétiques provenant de centaines de milliers de personnes, les chercheurs ont découvert que les tests de charge identifient les gènes qui affectent principalement la maladie étudiée, avec peu d’effet sur les autres traits, tandis que le GWAS peut identifier à la fois ces gènes spécifiques à la maladie et les gènes qui influencent de nombreuses maladies et processus biologiques.
« Notre étude explique pourquoi les méthodes produisent des résultats différents et pourquoi les deux sont biologiquement importantes », a déclaré Hakhamanesh Mostafavi, Ph.D., co-auteur principal de l’étude, professeur adjoint au Département de santé de la population et au Centre de génétique humaine et de génomique, à la NYU Grossman School of Medicine.
« Ces résultats apportent une nouvelle clarté sur ce que les découvertes génétiques révèlent sur le risque de maladie et sur la manière dont elles devraient être utilisées dans des applications telles que le développement de médicaments. »
Une nouvelle approche est nécessaire
Les scientifiques utilisent depuis longtemps GWAS pour rechercher de vastes ensembles de données génétiques afin de trouver des gènes associés à des maladies. Les résultats ont toutefois été confus, car les GWAS impliquent généralement des centaines de gènes par maladie, ce qui rend difficile de savoir lesquels sont réellement importants.
Plus récemment, grâce aux biobanques massives, les tests de charge sont devenus suffisamment puissants pour révéler une image différente : beaucoup moins de gènes, plus interprétables, liés aux mêmes maladies. Cela a soulevé la question de savoir laquelle reflète le mieux la biologie de la maladie et pourquoi.
Les chercheurs ont découvert qu’une des principales raisons expliquant la différence entre les résultats des deux tests est que les gènes varient en termes de nombre de caractéristiques (par exemple, la taille ou les maladies cardiaques) ou de processus biologiques qu’ils affectent. Certains gènes influencent principalement un trait, tandis que d’autres affectent plusieurs traits simultanément.
Les variantes qui perturbent gravement ces gènes « multi-traits » ont de vastes conséquences et sont supprimées par l’évolution car elles rendent souvent plus difficile la survie ou la reproduction. Cela signifie qu’ils se retrouvent chez moins de personnes et sont donc plus difficiles à détecter par les tests de charge.
En revanche, GWAS peut toujours trouver ces gènes car les variantes régulatrices de l’ADN affectent souvent l’activité des gènes de manière plus limitée, permettant à ces variantes d’échapper à l’élimination évolutive.
Les auteurs de l’étude proposent que deux caractéristiques génétiques soient essentielles à la priorisation idéale des gènes par rapport à tout risque ou trait de maladie. Le premier est « l’importance » : dans quelle mesure un gène affecte la maladie s’il est perturbé. La seconde est la « spécificité » d’un trait : si un gène affecte principalement une maladie ou plusieurs traits. Comprendre ces deux caractéristiques aiderait les chercheurs à identifier les meilleures cibles thérapeutiques et à anticiper les effets secondaires potentiels.
Une découverte connexe concernait la valeur p, une mesure standard permettant de déterminer si un résultat d’étude, y compris celui d’un GWAS ou d’un test de charge, peut être considéré comme « réel » ou s’il est plutôt susceptible de s’être produit par hasard.
De manière frappante, l’étude montre que les valeurs p du GWAS et des tests de charge sont un mauvais indicateur de l’importance d’un gène. Cela est important car l’identification de gènes importants peut révéler quels processus biologiques sont au cœur de la biologie des maladies.
« Nos résultats ne signifient pas que le GWAS et les tests de charge manquent d’informations utiles pour déduire l’importance des gènes », a déclaré Mostafavi. « Ils n’ont tout simplement pas été interprétés de cette manière auparavant. Nous pensons que de nouvelles méthodes sont nécessaires pour déduire cette caractéristique génétique biologique clé. »
À l’avenir, l’équipe a commencé à développer des méthodes pour hiérarchiser les gènes par importance. Le GWAS ou les tests de charge n’ont pas à eux seuls suffisamment de puissance pour estimer avec précision dans quelle mesure chaque gène affecte la maladie. Mais en combinant ces résultats avec les données expérimentales en croissance rapide décrivant ce que chaque gène fait à l’intérieur des cellules, affirment les auteurs, les méthodes d’apprentissage automatique peuvent trouver des modèles partagés entre les gènes et améliorer les estimations.
« Ce serait révolutionnaire car cela nous permettrait d’exploiter toutes les données expérimentales au niveau cellulaire pour en apprendre davantage sur les caractéristiques au niveau humain, identifier les gènes de maladie les plus importants et rationaliser le développement de médicaments », a déclaré le co-auteur principal Jeffrey Spence, Ph.D., professeur adjoint à l’Université de Californie à San Francisco.