L’attuale pandemia di COVID-19 ha creato molti problemi che gli hacker sono stati felici di attaccare. Dalle visiere stampate in 3D alle maschere mediche fatte in casa fino alla sostituzione di un ventilatore meccanico completo, il flusso di idee è stato stimolante e commovente. Allo stesso tempo, ci sono stati tentativi di avanzare in un altro settore: nella ricerca volta a combattere il virus stesso.
A quanto pare, il potenziale più grande per fermare l’attuale pandemia e superare tutte le successive risiede in un approccio che cerca di andare alla radice del problema. Questo approccio “conosci il tuo nemico” è adottato dal progetto di calcolo Folding@Home. Milioni di persone hanno aderito al progetto e stanno donando parte della potenza di elaborazione dei loro processori e GPU, creando così il più grande supercomputer [distribuito] della storia.
Ma a cosa servono esattamente tutti questi exaflop? Perché è necessario sfruttare tale potenza di calcolo
Innanzitutto la cosa più importante: perché sono necessarie le proteine?
Le proteine sono strutture vitali. Non solo forniscono materiale da costruzione per le cellule, ma servono anche come catalizzatori enzimatici per quasi tutte le reazioni biochimiche. Scoiattoli, siano essi
Per capire come le proteine acquisiscono la struttura che determina la loro funzione, dobbiamo ripercorrere le basi della biologia molecolare e il flusso delle informazioni nella cellula.
Produzione, o
I ribosomi si comportano come macchine assemblatrici: prendono il modello dell'mRNA e lo abbinano ad altri piccoli pezzi di RNA,
Questa sequenza di aminoacidi costituisce il primo livello della gerarchia strutturale delle proteine, motivo per cui viene chiamata
Legami a lungo raggio di parti proteiche
Al livello successivo di struttura tridimensionale, che va oltre quello primario, è stato dato un nome intelligente
Eliche alfa e foglietti beta nelle proteine. I legami idrogeno si formano durante l'espressione delle proteine.
Queste due strutture e le loro combinazioni formano il livello successivo della struttura proteica:
Inoltre, la stabilità delle strutture terziarie è assicurata da legami a lungo raggio tra amminoacidi. Un classico esempio di tali connessioni è
La struttura terziaria è stabilizzata da interazioni a lungo raggio come l'idrofobicità o i legami disolfuro
Possono verificarsi legami disolfuro tra
Modellare strutture alla ricerca di una cura per la malattia
Le catene polipeptidiche iniziano a piegarsi nella loro forma finale durante la traduzione, quando la catena in crescita esce dal ribosoma, proprio come un pezzo di filo di lega di memoria può assumere forme complesse quando riscaldato. Tuttavia, come sempre in biologia, le cose non sono così semplici.
In molte cellule, i geni trascritti subiscono ampie modifiche prima della traduzione, modificando in modo significativo la struttura di base della proteina rispetto alla sequenza di basi pura del gene. In questo caso i meccanismi traduzionali si avvalgono spesso dell'aiuto degli chaperoni molecolari, proteine che si legano temporaneamente alla catena polipeptidica nascente e le impediscono di assumere qualsiasi forma intermedia, dalla quale poi non potranno passare a quella finale.
Tutto questo per dire che prevedere la forma finale di una proteina non è un compito banale. Per decenni, l’unico modo per studiare la struttura delle proteine è stato attraverso metodi fisici come la cristallografia a raggi X. Fu solo alla fine degli anni ’1960 che i chimici biofisici iniziarono a costruire modelli computazionali del ripiegamento delle proteine, concentrandosi principalmente sulla modellazione della struttura secondaria. Questi metodi e i loro discendenti richiedono enormi quantità di dati di input oltre alla struttura primaria - ad esempio, tabelle di angoli di legame degli amminoacidi, elenchi di idrofobicità, stati caricati e persino conservazione della struttura e della funzione su scale temporali evolutive - tutto al fine di indovina cosa succederà, assomiglia alla proteina finale.
I metodi computazionali odierni per la previsione della struttura secondaria, come quelli in esecuzione sulla rete Folding@Home, funzionano con una precisione di circa l'80%, il che è abbastanza buono considerando la complessità del problema. I dati generati da modelli predittivi su proteine come la proteina spike SARS-CoV-2 verranno confrontati con i dati provenienti da studi fisici sul virus. Di conseguenza, sarà possibile ottenere l'esatta struttura della proteina e, forse, capire come il virus si attacca ai recettori
La ricerca sul ripiegamento delle proteine è al centro della nostra comprensione di così tante malattie e infezioni che anche quando utilizziamo la rete Folding@Home per capire come sconfiggere il COVID-19, che abbiamo visto esplodere in crescita ultimamente, la rete non riuscirà a sopravvivere. Non restare inattivo per un lungo periodo di lavoro. Si tratta di uno strumento di ricerca particolarmente adatto per studiare i modelli proteici che sono alla base di dozzine di malattie legate al misfolding delle proteine, come il morbo di Alzheimer o la variante della malattia di Creutzfeldt-Jakob, spesso erroneamente chiamata malattia della mucca pazza. E quando inevitabilmente apparirà un altro virus, saremo pronti a ricominciare a combatterlo.
Fonte: habr.com