Environ 25 millions d’Américains souffrent d’une maladie génétique rare, et nombre d’entre eux souffrent non seulement d’un manque de traitements efficaces, mais également d’un manque d’informations pertinentes sur leur maladie. Les cliniciens peuvent ne pas savoir ce qui cause les symptômes d’un patient, comment sa maladie évoluera ou même avoir un diagnostic clair. Les chercheurs se sont tournés vers le génome humain pour trouver des réponses, et de nombreuses mutations génétiques à l’origine de maladies ont été identifiées, mais jusqu’à 70 % des patients n’ont toujours pas d’explication génétique claire.
Dans un article publié dans Cellule moléculaireIain Cheeseman, membre du Whitehead Institute, Jimmy Ly, étudiant diplômé, et ses collègues proposent que les chercheurs et les cliniciens puissent obtenir plus d’informations sur le génome des patients en les examinant d’une manière différente.
L’idée commune est que chaque gène code pour une protéine. Quelqu’un qui étudie si un patient a une mutation ou une version d’un gène qui contribue à sa maladie recherchera donc des mutations qui affectent le produit protéique « connu » de ce gène.
Cependant, Cheeseman et d’autres découvrent que la majorité des gènes codent pour plus d’une protéine. Cela signifie qu’une mutation qui peut paraître insignifiante parce qu’elle ne semble pas affecter la protéine connue pourrait néanmoins altérer une protéine différente fabriquée par le même gène. Cheeseman et Ly ont montré que les mutations affectant une ou plusieurs protéines du même gène peuvent contribuer différemment à la maladie.
Dans leur article, les chercheurs partagent d’abord ce qu’ils ont appris sur la façon dont les cellules utilisent la capacité de générer différentes versions de protéines à partir du même gène. Ensuite, ils examinent comment les mutations qui affectent ces protéines contribuent à la maladie. Grâce à une collaboration avec le co-auteur Mark Fleming, pathologiste en chef du Boston Children’s Hospital, ils proposent deux études de cas de patients présentant des présentations atypiques d’une anémie rare liée à des mutations qui affectent sélectivement une seule des deux protéines produites par le gène impliqué dans la maladie.
« Nous espérons que ce travail démontrera l’importance de déterminer si un gène d’intérêt produit plusieurs versions d’une protéine et quel est le rôle de chaque version dans la santé et la maladie », explique Ly. « Ces informations pourraient conduire à une meilleure compréhension de la biologie des maladies, à de meilleurs diagnostics et peut-être un jour à des thérapies adaptées pour traiter ces maladies. »
Repenser la façon dont les cellules utilisent les gènes
Les cellules disposent de plusieurs moyens pour produire différentes versions d’une protéine, mais la variation étudiée par Cheeseman et Ly se produit lors de la production de protéines à partir du code génétique. Les machines cellulaires construisent chaque protéine selon les instructions d’une séquence génétique qui commence par un « codon de départ » et se termine par un « codon d’arrêt ».
Cependant, certaines séquences génétiques contiennent plus d’un codon d’initiation, dont beaucoup se cachent à la vue de tous. Si la machinerie cellulaire ignore le premier codon d’initiation et en détecte un deuxième, elle peut construire une version plus courte de la protéine. Dans d’autres cas, la machinerie peut détecter une section qui ressemble beaucoup à un codon d’initiation à un point plus précoce de la séquence que son point de départ typique et construire une version plus longue de la protéine.
Ces événements peuvent ressembler à des erreurs : la machinerie cellulaire crée accidentellement la mauvaise version de la bonne protéine. Au contraire, la production de protéines à partir de ces points de départ alternatifs est une caractéristique importante de la biologie cellulaire qui existe entre les espèces. Lorsque Ly a retracé l’évolution de certains gènes pour produire plusieurs protéines, il a découvert qu’il s’agissait d’un processus commun et robuste qui a été préservé tout au long de l’histoire de l’évolution pendant des millions d’années.
Ly montre que l’une de ses fonctions est d’envoyer des versions d’une protéine à différentes parties de la cellule. De nombreuses protéines contiennent des séquences de type code postal qui indiquent à la machinerie cellulaire où les délivrer afin que les protéines puissent faire leur travail. Ly a trouvé de nombreux exemples dans lesquels des versions plus longues et plus courtes de la même protéine contenaient différents codes postaux et se retrouvaient à différents endroits de la cellule.
Ly a notamment découvert de nombreux cas dans lesquels une version d’une protéine s’est retrouvée dans les mitochondries, des structures qui fournissent de l’énergie aux cellules, tandis qu’une autre version s’est retrouvée ailleurs. En raison du rôle des mitochondries dans le processus essentiel de production d’énergie, les mutations des gènes mitochondriaux sont souvent impliquées dans la maladie.
Ly se demandait ce qui se passerait lorsqu’une mutation pathogène élimine une version d’une protéine mais laisse l’autre intacte, ce qui fait que la protéine n’atteint qu’une de ses deux destinations prévues. Il a consulté une base de données contenant des informations génétiques sur des personnes atteintes de maladies rares pour voir si de tels cas existaient, et a constaté que c’était le cas. En fait, il pourrait y avoir des dizaines de milliers de cas de ce type. Cependant, sans accès aux gens, Ly n’avait aucun moyen de savoir quelles en seraient les conséquences en termes de symptômes et de gravité de la maladie.
Pendant ce temps, Cheeseman avait commencé à travailler avec l’hôpital pour enfants de Boston pour favoriser les collaborations entre le Whitehead Institute et les chercheurs et cliniciens de l’hôpital afin d’accélérer le passage de la découverte de la recherche à l’application clinique. Grâce à ces efforts, Cheeseman et Ly ont rencontré Fleming.
Un groupe de patients de Fleming souffre d’un type d’anémie appelée SIFD (anémie sidéroblastique avec immunodéficience en cellules B, fièvres périodiques et retard de développement) qui est causée par des mutations du gène TRNT1. TRNT1 est l’un des gènes que Ly avait identifié comme produisant une version mitochondriale de sa protéine et une autre version qui se retrouve ailleurs : dans le noyau.
Fleming a partagé des données anonymisées de patients avec Ly, et Ly a découvert deux cas intéressants dans les données génétiques. La plupart des patients présentaient des mutations altérant les deux versions de la protéine, mais un patient présentait une mutation qui éliminait uniquement la version mitochondriale de la protéine, tandis qu’un autre patient présentait une mutation éliminant uniquement la version nucléaire.
Lorsque Ly a partagé ses résultats, Fleming a révélé que ces deux patients présentaient des présentations très atypiques de SIFD, confortant l’hypothèse de Ly selon laquelle des mutations affectant différentes versions d’une protéine auraient des conséquences différentes. Le patient qui ne possédait que la version mitochondriale était anémique mais son développement était normal. Le patient dépourvu de la version mitochondriale de la protéine ne présentait pas de retard de développement ni d’anémie chronique, mais présentait d’autres symptômes immunitaires et n’a été correctement diagnostiqué qu’à la cinquantaine.
Il existe probablement d’autres facteurs contribuant à la présentation exacte de la maladie chez chaque patient, mais le travail de Ly commence à percer le mystère de leurs symptômes atypiques.
Cheeseman et Ly veulent sensibiliser davantage de cliniciens à la prévalence des gènes codant pour plus d’une protéine, afin qu’ils sachent vérifier les mutations affectant l’une des versions protéiques qui pourraient contribuer à la maladie. Par exemple, plusieurs mutations de TRNT1 qui éliminent uniquement la version plus courte de la protéine ne sont pas signalées comme pathogènes par les outils d’évaluation actuels.
Les chercheurs du laboratoire Cheeseman, dont Ly et l’étudiant diplômé Matteo Di Bernardo, développent actuellement un nouvel outil d’évaluation pour les cliniciens, appelé SwissIsoform, qui identifiera les mutations pertinentes qui affectent des versions spécifiques de protéines, y compris les mutations qui autrement seraient manquées.
« Les travaux de Jimmy et Iain soutiendront à l’échelle mondiale l’interprétation des variantes des maladies génétiques et aideront à relier les différences génétiques aux variations des symptômes de la maladie », a déclaré Fleming. « En fait, nous avons récemment identifié deux autres patients présentant des mutations affectant uniquement les versions mitochondriales de deux autres protéines, qui présentent également des symptômes plus légers que les patients présentant des mutations affectant les deux versions. »
À long terme, les chercheurs espèrent que leurs découvertes pourraient aider à comprendre les bases moléculaires de la maladie et à développer de nouvelles thérapies géniques : une fois que les chercheurs ont compris ce qui s’est mal passé dans une cellule pour provoquer la maladie, ils sont mieux équipés pour trouver une solution. Dans l’immédiat, les chercheurs espèrent que leurs travaux feront la différence en fournissant de meilleures informations aux cliniciens et aux personnes atteintes de maladies rares.
« En tant que chercheur fondamental qui n’interagit généralement pas avec les patients, il y a quelque chose de très satisfaisant à savoir que le travail que vous faites aide des personnes spécifiques », a déclaré Cheeseman. « Alors que mon laboratoire évolue vers cette nouvelle orientation, j’ai entendu de nombreuses histoires de personnes essayant de naviguer dans une maladie rare et d’obtenir simplement des réponses, et cela nous a vraiment motivés, alors que nous travaillons à fournir de nouvelles informations sur la biologie de la maladie. »