Des chercheurs du Massachusetts Institute of Technology (MIT) ont mis au point un système d’intelligence artificielle nommé DefensePredictor, capable de détecter en quelques minutes de nouvelles protéines impliquées dans la défense immunitaire des bactéries, alors que les méthodes traditionnelles requièrent souvent des semaines, voire des mois. Lors de son premier test, l’algorithme a identifié plus de 600 protéines auparavant non associées à l’immunité dans divers souches d’Escherichia coli.

Une partie de ces protéines, vérifiées en laboratoire, ont effectivement montré une protection des bactéries contre les attaques des bactériophages, des virus capables de décimer jusqu’à un quart de la population bactérienne en seulement 24 heures. Cela prouve que l’IA ne se contente pas de classer des systèmes connus, mais découvre des mécanismes de protection fonctionnellement actifs et jusqu’alors méconnus.

Cette recherche s’appuie sur la caractéristique fondamentale des bactéries : leur lutte évolutive constante contre les virus. En réponse aux attaques des phages, ces micro-organismes ont développé une variété de stratégies immunitaires, allant de la destruction de l’ADN viral à des systèmes complexes de « mémorisation » d’infections. Le plus célèbre de ces systèmes, CRISPR, a d’ailleurs été découvert comme une méthode de protection bactérienne avant d’être redéveloppé en tant qu’outil d’édition génétique.

Cependant, CRISPR n’est qu’un exemple parmi de nombreux mécanismes de défense. Les scientifiques ont déjà identifié des centaines d’autres voies de protection bactérienne, mais une grande partie reste encore inexplorée en raison des limitations des méthodes classiques : les gènes sont souvent dispersés dans le génome et ne forment pas de clusters évidents.

Illustration : Nano Banana

C’est précisément ce défi que tente de surmonter le modèle DefensePredictor. Fondé sur une architecture de langage pour protéines, ESM-2, le système apprend à analyser les séquences d’acides aminés de manière similaire à la compréhension du texte par des modèles de langage avancés. Les protéines sont envisagées comme des « séquences de 20 lettres », formant des structures et des fonctions complexes.

Pour entraîner le modèle, les chercheurs du MIT ont utilisé une base de données constituée par un algorithme précédent, DefenseFinder, rassemblant environ 15 000 protéines associées à la défense immunitaire ainsi que plus de 186 000 protéines sans cette fonction, provenant d’environ 17 000 génomes microbiaux.

Après l’entraînement, DefensePredictor a analysé 69 souches d’E. coli et mis en évidence plus de 600 protéines potentielles de défense, dont plus de 100 étaient entièrement nouvelles. Fait intéressant, près de la moitié d’entre elles n’étaient pas proches dans le génome, ce qui allait à l’encontre de la précédente hypothèse selon laquelle des systèmes collaboratifs se regroupent généralement.

Pour valider leurs découvertes, les chercheurs ont inséré artificiellement certaines de ces protéines dans une souche vulnérable de bactéries, puis les ont exposées à différents bactériophages. Environ 45 % des protéines ont fourni une protection contre au moins un virus, confirmant leur rôle fonctionnel.

Une analyse plus approfondie, élargie à plus de 1000 espèces microbiennes, a révélé des milliers de protéines de défense supplémentaires jusqu’alors non décrites dans la littérature scientifique.

Parallèlement, une autre équipe de l’Institut Pasteur a utilisé ses propres modèles d’IA pour prédire environ 2,4 millions de protéines antivirales dans plus de 32 000 génomes bactériens, soulignant l’ampleur des diversités biologiques cachées.

Les chercheurs notent que les systèmes de défense bactérienne représentent un vaste réservoir inexploré de mécanismes biologiques. Au-delà de CRISPR, d’autres systèmes, tels que les complexes de « toxines-antitoxines » et des outils de biotechnologie, trouvent des applications variées allant de l’ingénierie génétique à la création de « commutateurs » biologiques pour le contrôle d’organismes modifiés.

Cependant, un défi persiste : la plupart de ces systèmes sont extrêmement difficiles à détecter par des méthodes classiques. C’est pourquoi les approches basées sur l’IA deviennent cruciales — elles permettent d’analyser des millions de séquences et de repérer des motifs fonctionnels invisibles à l’œil humain.

D’après les chercheurs, l’objectif final de ces systèmes n’est pas seulement d’accélérer la découverte de nouveaux outils biologiques, mais aussi de comprendre l’évolution des systèmes immunitaires chez les micro-organismes. Ces découvertes pourraient mener à une nouvelle génération de technologies, allant vers des méthodes d’édition génétique plus précises et vers des outils moléculaires radicalement nouveaux pour la médecine et la biologie synthétique.

Points à retenir

  • DefensePredictor, une IA développée par le MIT, détecte rapidement de nouvelles protéines immunitaires.
  • La recherche pourrait enrichir notre compréhension des mécanismes bactériaux de défense.
  • Plus de 600 protéines protectrices ont été identifiées lors des tests initiaux.
  • Les systèmes de défense bactérienne offrent de nombreuses pistes d’exploration scientifique.
  • Les approches IA facilitent l’analyse de grandes quantités de données biologiques.

Ces révélations ouvrent la voie à un domaine fascinant d’exploration. Imaginez les implications de cette recherche sur notre compréhension des systèmes immunitaires dans divers organismes. La biologie, grâce à ces avancées, pourrait accéder à de nouvelles frontières, transformant non seulement notre approche de la médecine, mais aussi notre manière d’interagir avec le vivant. Cela nous pousse en tant que citoyens et scientifiques à réfléchir sur le pouvoir et les responsabilités que nous avons face à la nature et à nos propres découvertes. Il est essentiel de se demander comment nous pouvons utiliser ces nouvelles connaissances pour le bien commun, tout en regardant avec prudence les innovations à venir.


Partager : X Facebook WhatsApp LinkedIn Reddit

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *