La pandémie actuelle de COVID-19 a créé de nombreux problèmes que les pirates informatiques se sont fait un plaisir de s’attaquer. Des écrans faciaux imprimés en 3D aux masques médicaux faits maison en passant par le remplacement d'un ventilateur mécanique complet, le flux d'idées était inspirant et réconfortant. Parallèlement, des tentatives ont été faites pour progresser dans un autre domaine : la recherche visant à combattre le virus lui-même.
Apparemment, le plus grand potentiel pour arrêter la pandémie actuelle et dépasser toutes les futures réside dans une approche qui tente d’aller à la racine même du problème. Cette approche « connaissez votre ennemi » est adoptée par le projet informatique Folding@Home. Des millions de personnes se sont inscrites au projet et font don d'une partie de la puissance de traitement de leurs processeurs et GPU, créant ainsi le plus grand supercalculateur [distribué] de l'histoire.
Mais à quoi servent exactement tous ces exaflops ? Pourquoi est-il nécessaire de consacrer une telle puissance de calcul à
Tout d’abord, la chose la plus importante : pourquoi les protéines sont-elles nécessaires ?
Les protéines sont des structures vitales. Ils fournissent non seulement des matériaux de construction aux cellules, mais servent également de catalyseurs enzymatiques pour presque toutes les réactions biochimiques. Les écureuils, qu'ils soient
Pour comprendre comment les protéines acquièrent la structure qui détermine leur fonction, il faut revoir les bases de la biologie moléculaire et du flux d’informations dans la cellule.
Production, ou
Les ribosomes agissent comme des machines d'assemblage : ils prennent le modèle d'ARNm et le font correspondre à d'autres petits morceaux d'ARN,
Cette séquence d'acides aminés constitue le premier niveau de la hiérarchie structurelle des protéines, c'est pourquoi on l'appelle
Liaisons à longue portée des parties protéiques
Le niveau suivant de structure tridimensionnelle, allant au-delà du niveau primaire, a reçu un nom astucieux
Hélices alpha et feuilles bêta dans les protéines. Des liaisons hydrogène se forment lors de l’expression des protéines.
Ces deux structures et leurs combinaisons forment le niveau suivant de la structure protéique -
De plus, la stabilité des structures tertiaires est assurée par des liaisons à longue portée entre acides aminés. Un exemple classique de telles connexions est
La structure tertiaire est stabilisée par des interactions à longue portée telles que l'hydrophobie ou les liaisons disulfure
Des liaisons disulfure peuvent se produire entre
Modéliser des structures à la recherche d’un remède aux maladies
Les chaînes polypeptidiques commencent à se replier dans leur forme finale pendant la traduction, à mesure que la chaîne en croissance quitte le ribosome, un peu comme un morceau de fil d'alliage à mémoire peut prendre des formes complexes lorsqu'il est chauffé. Cependant, comme toujours en biologie, les choses ne sont pas si simples.
Dans de nombreuses cellules, les gènes transcrits subissent une édition approfondie avant la traduction, modifiant considérablement la structure de base de la protéine par rapport à la séquence de bases pure du gène. Dans ce cas, les mécanismes de traduction font souvent appel à des chaperons moléculaires, des protéines qui se lient temporairement à la chaîne polypeptidique naissante et l’empêchent de prendre une forme intermédiaire, à partir de laquelle elles ne pourront alors pas passer à la forme finale.
Tout cela pour dire que prédire la forme finale d’une protéine n’est pas une tâche anodine. Pendant des décennies, la seule façon d’étudier la structure des protéines était de recourir à des méthodes physiques telles que la cristallographie aux rayons X. Ce n’est qu’à la fin des années 1960 que les chimistes biophysiques ont commencé à construire des modèles informatiques du repliement des protéines, en se concentrant principalement sur la modélisation de la structure secondaire. Ces méthodes et leurs descendants nécessitent d'énormes quantités de données d'entrée en plus de la structure primaire - par exemple, des tableaux d'angles de liaison des acides aminés, des listes d'hydrophobie, d'états chargés et même la conservation de la structure et de la fonction sur des échelles de temps évolutives - tout cela afin de devinez ce qui va se passer et ressemble à la protéine finale.
Les méthodes de calcul actuelles pour la prédiction des structures secondaires, telles que celles exécutées sur le réseau Folding@Home, fonctionnent avec une précision d'environ 80 %, ce qui est plutôt bon compte tenu de la complexité du problème. Les données générées par des modèles prédictifs sur des protéines telles que la protéine de pointe du SRAS-CoV-2 seront comparées aux données issues d’études physiques du virus. Il sera ainsi possible d’obtenir la structure exacte de la protéine et, peut-être, de comprendre comment le virus s’attache aux récepteurs.
La recherche sur le repliement des protéines est au cœur de notre compréhension de tant de maladies et d'infections que même lorsque nous utilisons le réseau Folding@Home pour découvrir comment vaincre le COVID-19, dont nous avons vu la croissance exploser ces derniers temps, le réseau gagne. Je ne dois pas rester longtemps inactif. Il s'agit d'un outil de recherche bien adapté à l'étude des modèles protéiques à l'origine de dizaines de maladies liées au mauvais repliement des protéines, telles que la maladie d'Alzheimer ou la variante de la maladie de Creutzfeldt-Jakob, souvent appelée à tort maladie de la vache folle. Et lorsqu’un autre virus apparaîtra inévitablement, nous serons prêts à recommencer à le combattre.
Source: habr.com