Så hva er egentlig "proteinfolding"?

Så hva er egentlig "proteinfolding"?

Den nåværende COVID-19-pandemien har skapt mange problemer som hackere har vært glade for å angripe. Fra 3D-trykte ansiktsskjermer og hjemmelagde medisinske masker til å erstatte en komplett mekanisk ventilator, var strømmen av ideer inspirerende og hjertevarmende. Samtidig var det forsøk på å komme videre på et annet område: i forskning rettet mot å bekjempe selve viruset.

Tilsynelatende ligger det største potensialet for å stoppe den nåværende pandemien og overgå alle påfølgende i en tilnærming som prøver å komme til selve roten av problemet. Denne "kjenn din fiende"-tilnærming er tatt av databehandlingsprosjektet Folding@Home. Millioner av mennesker har meldt seg på prosjektet og donerer noe av prosessorkraften til deres prosessorer og GPUer, og skaper dermed den største [distribuerte] superdatamaskinen i historien.

Men hva brukes egentlig alle disse exaflopene til? Hvorfor er det nødvendig å kaste slik datakraft på proteinfolding? Hva slags biokjemi er på jobb her, hvorfor må proteiner i det hele tatt foldes? Her er en rask oversikt over proteinfolding: hva det er, hvordan det skjer og hvorfor det er viktig.

Først, det viktigste: hvorfor trengs proteiner?

Proteiner er livsviktige strukturer. De gir ikke bare byggemateriale for celler, men fungerer også som enzymkatalysatorer for nesten alle biokjemiske reaksjoner. Ekorn, det være seg strukturell eller enzymatiske, er lange kjeder aminosyrer, plassert i en bestemt rekkefølge. Funksjonene til proteiner bestemmes av hvilke aminosyrer som er lokalisert visse steder på proteinet. Hvis for eksempel et protein trenger å binde seg til et positivt ladet molekyl, må bindingsstedet fylles med negativt ladede aminosyrer.

For å forstå hvordan proteiner får strukturen som bestemmer funksjonen deres, må vi gå gjennom det grunnleggende om molekylærbiologi og informasjonsflyten i cellen.

Produksjon, eller uttrykk proteiner begynner med prosessen transkripsjoner. Under transkripsjon avvikles DNA-dobbelthelixen, som inneholder cellens genetiske informasjon, delvis, slik at nitrogenbasene i DNA-et blir tilgjengelige for et enzym som kalles RNA-polymerase. Jobben til RNA-polymerase er å lage en RNA-kopi, eller transkripsjon, av et gen. Denne kopien av et gen som kalles messenger RNA (mRNA), er et enkelt molekyl ideelt for å kontrollere intracellulære proteinfabrikker, ribosomersom driver med produksjon, eller kringkaste proteiner.

Ribosomer fungerer som monteringsmaskiner - de tar mRNA-malen og matcher den med andre små RNA-biter, overføre RNA (tRNA). Hvert tRNA har to aktive regioner - en del av tre baser kalt antikodon, som må matche de tilsvarende kodonene til mRNA, og et sted for binding av en aminosyre spesifikk for dette kodon. Under translasjon prøver tRNA-molekyler i ribosomet tilfeldig å binde seg til mRNA ved hjelp av antikodoner. Hvis det lykkes, fester tRNA-molekylet sin aminosyre til den forrige, og danner neste ledd i kjeden av aminosyrer kodet av mRNA.

Denne sekvensen av aminosyrer er det første nivået i proteinstrukturhierarkiet, og det er derfor det kalles primær struktur. Hele den tredimensjonale strukturen til et protein og dets funksjoner er direkte avledet fra primærstrukturen, og avhenger av de ulike egenskapene til hver av aminosyrene og deres interaksjoner med hverandre. Uten disse kjemiske egenskapene og aminosyreinteraksjonene, polypeptider de ville forbli lineære sekvenser uten en tredimensjonal struktur. Dette kan sees hver gang du lager mat - i denne prosessen er det termisk denaturering tredimensjonal struktur av proteiner.

Lang rekkevidde bindinger av proteindeler

Det neste nivået av tredimensjonal struktur, som går utover den primære, fikk et smart navn sekundær struktur. Det inkluderer hydrogenbindinger mellom aminosyrer med relativt nær virkning. Hovedessensen av disse stabiliserende interaksjonene kommer ned til to ting: alfa-helikser и beta-liste. Alfa-helixen danner den tett kveilede regionen av polypeptidet, mens beta-arket danner den glatte, brede regionen. Begge formasjonene har både strukturelle og funksjonelle egenskaper, avhengig av egenskapene til deres inngående aminosyrer. For eksempel, hvis alfahelixen hovedsakelig består av hydrofile aminosyrer, som arginin eller lysin, så vil den mest sannsynlig delta i vandige reaksjoner.

Så hva er egentlig "proteinfolding"?
Alfa-helikser og beta-ark i proteiner. Hydrogenbindinger dannes under proteinekspresjon.

Disse to strukturene og deres kombinasjoner danner det neste nivået av proteinstruktur - tertiær struktur. I motsetning til enkle fragmenter av sekundær struktur, er tertiær struktur hovedsakelig påvirket av hydrofobicitet. Sentrene til de fleste proteiner inneholder svært hydrofobe aminosyrer, som f.eks alanin eller metionin, og vann er utelukket derfra på grunn av radikalenes "fettete" natur. Disse strukturene vises ofte i transmembranproteiner innebygd i lipid-dobbeltlagsmembranen som omgir celler. De hydrofobe områdene av proteinene forblir termodynamisk stabile inne i fettdelen av membranen, mens de hydrofile områdene av proteinet er utsatt for det vandige miljøet på begge sider.

Stabiliteten til tertiære strukturer er også sikret av langdistansebindinger mellom aminosyrer. Et klassisk eksempel på slike sammenhenger er disulfidbro, forekommer ofte mellom to cysteinradikaler. Hvis du luktet noe som litt som råtne egg i en frisørsalong under en permanent prosedyre på en klients hår, så var dette en delvis denaturering av tertiærstrukturen til keratinet i håret, som oppstår gjennom reduksjon av disulfidbindinger med hjelp av svovelholdig tiol blandinger.

Så hva er egentlig "proteinfolding"?
Tertiær struktur stabiliseres av lang rekkevidde interaksjoner som hydrofobicitet eller disulfidbindinger

Disulfidbindinger kan oppstå mellom cystein radikaler i samme polypeptidkjede, eller mellom cysteiner fra forskjellige komplette kjeder. Interaksjoner mellom ulike kjeder dannes kvartær nivå av proteinstruktur. Et utmerket eksempel på kvartær struktur er hemoglobin det er i blodet ditt. Hvert hemoglobinmolekyl består av fire identiske globiner, proteindeler, som hver holdes i en spesifikk posisjon i polypeptidet av disulfidbroer, og er også assosiert med et hem-molekyl som inneholder jern. Alle de fire globinene er forbundet med intermolekylære disulfidbroer, og hele molekylet binder seg til flere luftmolekyler på en gang, opptil fire, og er i stand til å frigjøre dem etter behov.

Modellering av strukturer på jakt etter en kur mot sykdom

Polypeptidkjeder begynner å brette seg til sin endelige form under translasjonen, ettersom den voksende kjeden går ut av ribosomet, omtrent som et stykke minnelegeringstråd kan anta komplekse former når det varmes opp. Men som alltid i biologi er ting ikke så enkelt.

I mange celler gjennomgår transkriberte gener omfattende redigering før translasjon, noe som endrer den grunnleggende strukturen til proteinet betydelig sammenlignet med den rene basesekvensen til genet. I dette tilfellet henter translasjonsmekanismer ofte hjelp av molekylære chaperones, proteiner som binder seg midlertidig til den begynnende polypeptidkjeden og hindrer den i å ta på seg noen mellomform, hvorfra de da ikke vil kunne gå videre til den endelige.

Dette er alt for å si at å forutsi den endelige formen til et protein ikke er en triviell oppgave. I flere tiår var den eneste måten å studere strukturen til proteiner på gjennom fysiske metoder som røntgenkrystallografi. Det var først på slutten av 1960-tallet at biofysiske kjemikere begynte å bygge beregningsmodeller for proteinfolding, først og fremst konsentrert om sekundær strukturmodellering. Disse metodene og deres etterkommere krever enorme mengder inndata i tillegg til primærstrukturen - for eksempel tabeller over aminosyrebindingsvinkler, lister over hydrofobicitet, ladede tilstander og til og med bevaring av struktur og funksjon over evolusjonære tidsskalaer - alt for å gjett hva som vil skje se ut som det endelige proteinet.

Dagens beregningsmetoder for prediksjon av sekundær struktur, slik som de som kjører på Folding@Home-nettverket, fungerer med omtrent 80 % nøyaktighet – noe som er ganske bra med tanke på kompleksiteten til problemet. Data generert av prediktive modeller på proteiner som SARS-CoV-2 piggproteinet vil bli sammenlignet med data fra fysiske studier av viruset. Som et resultat vil det være mulig å få den nøyaktige strukturen til proteinet og kanskje forstå hvordan viruset fester seg til reseptorer angiotensin-konverterende enzym 2 en person som befinner seg i luftveiene som fører inn i kroppen. Hvis vi kan finne ut av denne strukturen, kan vi kanskje finne medisiner som blokkerer bindingen og forhindrer infeksjon.

Proteinfoldingsforskning er kjernen i vår forståelse av så mange sykdommer og infeksjoner at selv når vi bruker Folding@Home-nettverket for å finne ut hvordan vi kan beseire COVID-19, som vi har sett eksplodere i vekst i det siste, vil nettverket ikke være ledig lenge. arbeid. Det er et forskningsverktøy som egner seg godt for å studere proteinmønstrene som ligger til grunn for dusinvis av proteinfeilfoldingssykdommer, som Alzheimers sykdom eller varianten Creutzfeldt-Jakob sykdom, ofte feilaktig kalt kugalskap. Og når et annet virus uunngåelig dukker opp, vil vi være klare til å begynne å bekjempe det igjen.

Kilde: www.habr.com

Legg til en kommentar