Den nåværende COVID-19-pandemien har skapt mange problemer som hackere har vært glade for å angripe. Fra 3D-trykte ansiktsskjermer og hjemmelagde medisinske masker til å erstatte en komplett mekanisk ventilator, var strømmen av ideer inspirerende og hjertevarmende. Samtidig var det forsøk på å komme videre på et annet område: i forskning rettet mot å bekjempe selve viruset.
Tilsynelatende ligger det største potensialet for å stoppe den nåværende pandemien og overgå alle påfølgende i en tilnærming som prøver å komme til selve roten av problemet. Denne "kjenn din fiende"-tilnærming er tatt av databehandlingsprosjektet Folding@Home. Millioner av mennesker har meldt seg på prosjektet og donerer noe av prosessorkraften til deres prosessorer og GPUer, og skaper dermed den største [distribuerte] superdatamaskinen i historien.
Men hva brukes egentlig alle disse exaflopene til? Hvorfor er det nødvendig å kaste slik datakraft på
Først, det viktigste: hvorfor trengs proteiner?
Proteiner er livsviktige strukturer. De gir ikke bare byggemateriale for celler, men fungerer også som enzymkatalysatorer for nesten alle biokjemiske reaksjoner. Ekorn, det være seg
For å forstå hvordan proteiner får strukturen som bestemmer funksjonen deres, må vi gå gjennom det grunnleggende om molekylærbiologi og informasjonsflyten i cellen.
Produksjon, eller
Ribosomer fungerer som monteringsmaskiner - de tar mRNA-malen og matcher den med andre små RNA-biter,
Denne sekvensen av aminosyrer er det første nivået i proteinstrukturhierarkiet, og det er derfor det kalles
Lang rekkevidde bindinger av proteindeler
Det neste nivået av tredimensjonal struktur, som går utover den primære, fikk et smart navn
Alfa-helikser og beta-ark i proteiner. Hydrogenbindinger dannes under proteinekspresjon.
Disse to strukturene og deres kombinasjoner danner det neste nivået av proteinstruktur -
Stabiliteten til tertiære strukturer er også sikret av langdistansebindinger mellom aminosyrer. Et klassisk eksempel på slike sammenhenger er
Tertiær struktur stabiliseres av lang rekkevidde interaksjoner som hydrofobicitet eller disulfidbindinger
Disulfidbindinger kan oppstå mellom
Modellering av strukturer på jakt etter en kur mot sykdom
Polypeptidkjeder begynner å brette seg til sin endelige form under translasjonen, ettersom den voksende kjeden går ut av ribosomet, omtrent som et stykke minnelegeringstråd kan anta komplekse former når det varmes opp. Men som alltid i biologi er ting ikke så enkelt.
I mange celler gjennomgår transkriberte gener omfattende redigering før translasjon, noe som endrer den grunnleggende strukturen til proteinet betydelig sammenlignet med den rene basesekvensen til genet. I dette tilfellet henter translasjonsmekanismer ofte hjelp av molekylære chaperones, proteiner som binder seg midlertidig til den begynnende polypeptidkjeden og hindrer den i å ta på seg noen mellomform, hvorfra de da ikke vil kunne gå videre til den endelige.
Dette er alt for å si at å forutsi den endelige formen til et protein ikke er en triviell oppgave. I flere tiår var den eneste måten å studere strukturen til proteiner på gjennom fysiske metoder som røntgenkrystallografi. Det var først på slutten av 1960-tallet at biofysiske kjemikere begynte å bygge beregningsmodeller for proteinfolding, først og fremst konsentrert om sekundær strukturmodellering. Disse metodene og deres etterkommere krever enorme mengder inndata i tillegg til primærstrukturen - for eksempel tabeller over aminosyrebindingsvinkler, lister over hydrofobicitet, ladede tilstander og til og med bevaring av struktur og funksjon over evolusjonære tidsskalaer - alt for å gjett hva som vil skje se ut som det endelige proteinet.
Dagens beregningsmetoder for prediksjon av sekundær struktur, slik som de som kjører på Folding@Home-nettverket, fungerer med omtrent 80 % nøyaktighet – noe som er ganske bra med tanke på kompleksiteten til problemet. Data generert av prediktive modeller på proteiner som SARS-CoV-2 piggproteinet vil bli sammenlignet med data fra fysiske studier av viruset. Som et resultat vil det være mulig å få den nøyaktige strukturen til proteinet og kanskje forstå hvordan viruset fester seg til reseptorer
Proteinfoldingsforskning er kjernen i vår forståelse av så mange sykdommer og infeksjoner at selv når vi bruker Folding@Home-nettverket for å finne ut hvordan vi kan beseire COVID-19, som vi har sett eksplodere i vekst i det siste, vil nettverket ikke være ledig lenge. arbeid. Det er et forskningsverktøy som egner seg godt for å studere proteinmønstrene som ligger til grunn for dusinvis av proteinfeilfoldingssykdommer, som Alzheimers sykdom eller varianten Creutzfeldt-Jakob sykdom, ofte feilaktig kalt kugalskap. Og når et annet virus uunngåelig dukker opp, vil vi være klare til å begynne å bekjempe det igjen.
Kilde: www.habr.com