Diagnostic d’aide aux «empreintes digitales» immunitaires des maladies complexes

Votre système immunitaire abrite la vie d’une vie d’informations sur les menaces qu’elle a rencontrées – un Rolodex biologique de méchants. Souvent, les auteurs sont des virus et des bactéries que vous avez conquises; D’autres sont des agents d’infiltration comme les vaccins donnés pour déclencher des réponses immunitaires protectrices ou même des harengs rouges sous la forme de tissus sains capturés dans des feux croisés immunologiques.

Désormais, les chercheurs de Stanford Medicine ont conçu un moyen d’exploiter cette riche base de données interne pour diagnostiquer des maladies aussi diverses que les réponses du diabète Covid-19 aux vaccins contre la grippe. Bien qu’ils envisagent l’approche comme un moyen de dépister simultanément pour plusieurs maladies, la technique basée sur l’apprentissage en machine peut également être optimisée pour détecter les maladies auto-immunes complexes et difficiles à diagnostic telles que le lupus.

Dans une étude de près de 600 personnes – une bonne santé, d’autres personnes atteintes d’infections, y compris les maladies Covid-19 ou auto-immunes, notamment le lupus et le diabète de type 1 – l’algorithme développé par les chercheurs, appelée mal-ID pour l’apprentissage automatique pour le diagnostic et les structures des récepteurs des cellules B et T.

« Les boîtes à outils de diagnostic que nous utilisons aujourd’hui n’utilisent pas beaucoup le dossier interne du système immunitaire des maladies qu’il a rencontrées », a déclaré le boursier postdoctoral Maxim Zaslavsky, Ph.D. « Mais notre système immunitaire examine constamment notre corps avec des cellules B et T, qui agissent comme des capteurs de menace moléculaire.

« La combinaison des informations des deux bras principaux du système immunitaire nous donne une image plus complète de la réponse du système immunitaire à la maladie et des voies de l’auto-immunité et de la réponse vaccinale. »

Zaslavsky et Erin Craig sont les principaux auteurs de l’étude publiée le 21 février Science. Professeur de pathologie Scott Boyd, MD, Ph.D., et professeur agrégé de génétique et informatique Anshul Kundaje, Ph.D., sont les auteurs principaux de la recherche.

En plus d’aider le diagnostic de maladies délicates, MAL-ID pourrait suivre les réponses aux immunothérapies contre le cancer et sous-catégoriser les états pathologiques d’une manière qui pourrait aider à guider la prise de décision clinique, croient les chercheurs.

« Plusieurs des conditions que nous recherchions pourraient être significativement différentes à un niveau biologique ou moléculaire, mais nous les décrivons avec de larges termes qui ne tiennent pas nécessairement à la réponse spécialisée du système immunitaire », a déclaré Boyd, qui codirige le Sean N. Parker Center for Allergy and Asthma Research.

« MAL-ID pourrait nous aider à identifier les sous-catégories de conditions particulières qui pourraient nous donner des indices sur le type de traitement serait le plus utile pour l’état pathologique de quelqu’un. »

Déchiffrer le langage des protéines

Dans une approche de suivi des points, les scientifiques ont utilisé des techniques d’apprentissage automatique basées sur des modèles de langage importants ceux qui sous-tendent le chat de la maison sur les récepteurs de reconnaissance des menaces sur les cellules immunitaires appelées cellules T et les extrémités commerciales des anticorps (également appelés récepteurs) fabriqués par un autre type de cellule immunitaire appelée cellules B.

Ces modèles de langue recherchent des modèles dans de grands ensembles de données comme les textes des livres et des sites Web. Avec suffisamment de formation, ils peuvent utiliser ces modèles pour prédire le mot suivant d’une phrase, entre autres tâches.

Dans le cas de cette étude, les scientifiques ont appliqué un modèle grand langage formé sur des protéines, nourri du modèle des millions de séquences de récepteurs B et T des cellules T, et l’ont utilisé pour regrouper les récepteurs qui partagent les caractéristiques clés – comme déterminé par le modèle – qui pourraient suggérer des préférences de liaison similaires.

Cela pourrait donner un aperçu de ce que les déclencheurs ont provoqué la mobilisation du système immunitaire d’une personne – réduisant une armée de cellules T, de cellules B et d’autres cellules immunitaires équipées pour attaquer les menaces réelles et perçues.

« Les séquences de ces récepteurs immunitaires sont très variables », a déclaré Zaslavsky. « Cette variabilité aide le système immunitaire à détecter pratiquement tout, mais nous rend également plus difficile d’interpréter ce que ces cellules immunitaires ciblent.

« Dans cette étude, nous avons demandé si nous pouvions décoder le dossier du système immunitaire de ces rencontres de maladies en interprétant ces informations très variables avec de nouvelles techniques d’apprentissage automatique. Cette idée n’est pas nouvelle, mais nous avons manqué un moyen robuste de capturer les modèles de ces séquences de récepteurs immunitaires qui indiquent à quoi le système immunitaire répond. »

Les cellules B et les cellules T représentent deux bras séparés du système immunitaire, mais la façon dont ils font des protéines qui reconnaissent les agents ou les cellules infectieux qui doivent être éliminés est similaire. En bref, des segments spécifiques d’ADN dans les génomes des cellules sont mélangés au hasard et appariés – parfois avec un pincement supplémentaire de mutations supplémentaires pour pimenter les choses – pour créer des régions codantes qui, lorsque les structures protéiques sont assemblées, peuvent générer des trillions de cellules T).

L’aléatoire de ce processus signifie que ces anticorps ou récepteurs des cellules T ne sont pas conçus pour reconnaître des molécules spécifiques à la surface des envahisseurs. Mais leur diversité vertigineuse garantit qu’au moins quelques-uns se lieront à presque toutes les structures étrangères. (L’auto-immunité, ou une attaque par le système immunitaire sur les propres tissus du corps, est généralement – mais pas toujours – l’emprise par un processus de conditionnement, les cellules T et B passent tôt dans le développement qui élimine les cellules problématiques.)

L’acte de liaison stimule la cellule pour en faire beaucoup plus pour monter une attaque à grande échelle; La prévalence accrue subséquente de cellules avec des récepteurs qui correspondent aux structures tridimensionnelles similaires fournit une empreinte digitale biologique des maladies ou des conditions que le système immunitaire a ciblé.

Pour tester leur théorie, les chercheurs ont assemblé un ensemble de données de plus de 16 millions de séquences de récepteurs des cellules B et de plus de 25 millions de séquences de récepteurs des cellules T de 593 personnes avec l’un des six états immunitaires différents: des contrôles sains, des personnes infectées par le SARS-CoV-2 (le virus qui provoque le Covid-19) ou par le VIH, les personnes qui ont récemment reçu une influenza et des personnes atteintes de LUP ou de Type maladies). Zaslavsky et ses collègues ont ensuite utilisé leur approche d’apprentissage automatique pour rechercher des points communs entre les personnes ayant la même condition.

« Nous avons comparé les fréquences d’utilisation des segments, les séquences d’acides aminés des protéines résultantes et la façon dont le modèle représentait le » langage « des récepteurs, entre autres caractéristiques », a déclaré Boyd.

T et b cellules ensemble

Les chercheurs ont constaté que les séquences des récepteurs des cellules T fournissaient les informations les plus pertinentes sur le lupus et le diabète de type 1 tandis que les séquences des récepteurs des cellules B étaient les plus informatives dans l’identification de l’infection par le VIH ou le SAR-COV-2 ou la vaccination récente de la grippe. Dans tous les cas, cependant, la combinaison des résultats des cellules T et B a augmenté la capacité de l’algorithme à catégoriser avec précision les personnes par leur état de maladie, indépendamment du sexe, de l’âge ou de la race.

« Les approches traditionnelles ont parfois du mal à trouver des groupes de récepteurs qui semblent différents mais reconnaissent les mêmes cibles », a déclaré Zaslavsky. « Mais c’est là que les modèles de grande langue excellent. Ils peuvent apprendre la grammaire et les indices spécifiques au contexte du système immunitaire tout comme ils ont maîtrisé la grammaire et le contexte anglais. De cette manière, MAL-ID peut générer une compréhension interne de ces séquences qui nous donnent des informations que nous n’avons pas eues auparavant. »

Bien que les chercheurs aient développé un MAL-ID sur seulement six états immunologiques, ils envisagent que l’algorithme pourrait rapidement être adapté pour identifier les signatures immunologiques spécifiques à de nombreuses autres maladies et conditions. Ils sont particulièrement intéressés par les maladies auto-immunes comme le lupus, qui peut être difficile à diagnostiquer et à traiter efficacement.

« Les patients peuvent avoir du mal pendant des années avant qu’ils ne reçoivent un diagnostic, et même alors, les noms que nous donnons à ces maladies sont comme des termes parapluies qui négligent la diversité biologique derrière les maladies complexes », a déclaré Zaslavsky. « Si nous pouvons utiliser le MAL-ID pour démêler l’hétérogénéité derrière le lupus, ou la polyarthrite rhumatoïde, ce serait très cliniquement percutant. »

MAL-ID peut également aider les chercheurs à identifier de nouvelles cibles thérapeutiques pour de nombreuses conditions.

« La beauté de cette approche est qu’elle fonctionne même si nous ne savons pas au début quelles molécules ou structures que le système immunitaire cible », a déclaré Boyd. « Nous pouvons toujours obtenir les informations simplement en voyant des modèles similaires dans la façon dont les gens réagissent. Et, en approfondissant ces réponses, nous pouvons découvrir de nouvelles directions pour la recherche et les thérapies. »