L'actual pandèmia de COVID-19 ha creat molts problemes que els pirates informàtics han estat encantats d'atacar. Des de protectors facials impresos en 3D i màscares mèdiques casolanes fins a la substitució d'un ventilador mecànic complet, el flux d'idees va ser inspirador i reconfortant. Paral·lelament, s'ha intentat avançar en un altre àmbit: en la recerca destinada a combatre el propi virus.
Pel que sembla, el major potencial per aturar la pandèmia actual i superar totes les posteriors rau en un enfocament que intenta arribar a l'arrel mateix del problema. Aquest enfocament de "coneix el teu enemic" el fa el projecte informàtic Folding@Home. Milions de persones s'han inscrit al projecte i estan donant part de la potència de processament dels seus processadors i GPU, creant així el superordinador [distribuït] més gran de la història.
Però per a què serveixen exactament tots aquests exaflops? Per què és necessari llançar aquesta potència de càlcul?
En primer lloc, el més important: per què es necessiten proteïnes?
Les proteïnes són estructures vitals. No només proporcionen material de construcció per a les cèl·lules, sinó que també serveixen com a catalitzadors enzimàtics per a gairebé totes les reaccions bioquímiques. Esquirols, siguin ells
Per entendre com les proteïnes adquireixen l'estructura que determina la seva funció, hem de repassar els conceptes bàsics de la biologia molecular i el flux d'informació a la cèl·lula.
Producció, o
Els ribosomes actuen com a màquines d'assemblatge: agafen la plantilla d'ARNm i la combinen amb altres petites peces d'ARN,
Aquesta seqüència d'aminoàcids és el primer nivell de la jerarquia estructural de proteïnes, per això s'anomena
Enllaços de llarg abast de parts de proteïnes
El següent nivell d'estructura tridimensional, que va més enllà del principal, va rebre un nom intel·ligent
Hèlixs alfa i làmines beta en proteïnes. Els ponts d'hidrogen es formen durant l'expressió de proteïnes.
Aquestes dues estructures i les seves combinacions formen el següent nivell d'estructura de proteïnes:
A més, l'estabilitat de les estructures terciàries està assegurada per enllaços de llarg abast entre aminoàcids. Un exemple clàssic d'aquestes connexions és
L'estructura terciària s'estabilitza mitjançant interaccions de llarg abast com la hidrofobicitat o els enllaços disulfur
Es poden produir enllaços disulfur entre
Modelar estructures a la recerca d'una cura per a la malaltia
Les cadenes polipeptídiques comencen a plegar-se a la seva forma final durant la traducció, a mesura que la cadena en creixement surt del ribosoma, de la mateixa manera que un tros de cable d'aliatge de memòria pot adoptar formes complexes quan s'escalfa. Tanmateix, com sempre en biologia, les coses no són tan senzilles.
En moltes cèl·lules, els gens transcrits se sotmeten a una extensa edició abans de la traducció, canviant significativament l'estructura bàsica de la proteïna en comparació amb la seqüència de bases pura del gen. En aquest cas, els mecanismes translacionals solen comptar amb l'ajuda de chaperones moleculars, proteïnes que s'uneixen temporalment a la cadena polipeptídica naixent i impedeixen que adquireixi cap forma intermèdia, de la qual després no podran passar a la definitiva.
Tot això vol dir que predir la forma final d'una proteïna no és una tasca trivial. Durant dècades, l'única manera d'estudiar l'estructura de les proteïnes va ser mitjançant mètodes físics com la cristal·lografia de raigs X. No va ser fins a finals de la dècada de 1960 que els químics biofísics van començar a construir models computacionals de plegament de proteïnes, concentrant-se principalment en el modelatge d'estructura secundària. Aquests mètodes i els seus descendents requereixen enormes quantitats de dades d'entrada a més de l'estructura primària, per exemple, taules d'angles d'enllaç d'aminoàcids, llistes d'hidrofobicitat, estats carregats i fins i tot conservació de l'estructura i la funció en escales de temps evolutives, tot per tal de endevina què passarà sembla la proteïna final.
Els mètodes computacionals actuals per a la predicció d'estructures secundàries, com els que s'executen a la xarxa Folding@Home, funcionen amb una precisió aproximadament del 80%, cosa que és bastant bona tenint en compte la complexitat del problema. Les dades generades per models predictius sobre proteïnes com la proteïna espiga SARS-CoV-2 es compararan amb les dades d'estudis físics del virus. Com a resultat, serà possible obtenir l'estructura exacta de la proteïna i, potser, entendre com el virus s'uneix als receptors.
La investigació sobre el plegament de proteïnes és el centre de la nostra comprensió de tantes malalties i infeccions que, fins i tot quan utilitzem la xarxa Folding@Home per esbrinar com vèncer el COVID-19, que hem vist augmentar en creixement darrerament, la xarxa ho farà. no estar molt de temps inactiu. És una eina d'investigació molt adequada per estudiar els patrons de proteïnes que subjauen a desenes de malalties de plegament incorrecte de proteïnes, com la malaltia d'Alzheimer o la variant de la malaltia de Creutzfeldt-Jakob, sovint anomenada incorrectament malaltia de la vaca boja. I quan aparegui inevitablement un altre virus, estarem preparats per començar a combatre'l de nou.
Font: www.habr.com