Andmed meie sees: mida teevad bioinformaatikud?

Andmed meie sees: mida teevad bioinformaatikud?
Me räägime tuleviku inimestest, kes dešifreerivad orgaanilist suurkuupäeva. Viimase kahe aastakümne jooksul on analüüsitavate bioloogiliste andmete hulk inimese genoomi järjestamise tõttu mitmekordistunud. Enne seda ei osanud me isegi ette kujutada, et sõna otseses mõttes meie verre talletatud teabe abil on võimalik kindlaks teha meie päritolu, kontrollida, kuidas keha reageerib teatud ravimitele ja isegi muuta meie bioloogilist pärilikkust.

See ja teised artiklid ilmuvad esimesena ajaveeb meie veebisaidil. Nautige lugemist.

Keskmise bioinformaatiku atribuudid on samad, mis programmeerijal – punased silmad, kummardunud kehahoiak ja kohvitasside jäljed töölaual. Kuid selle laua juures ei töötata abstraktsete algoritmide ja käskude kallal, vaid looduse enda koodil, mis võib meile ja meid ümbritseva maailma kohta palju rääkida.

Selle ala spetsialistid tegelevad tohutute andmemahtudega (näiteks ühe inimese genoomi järjestamise tulemused võtavad enda alla umbes 100 gigabaiti). Seetõttu on sellise teabemassiivi töötlemiseks vaja andmeteaduse lähenemisviise ja tööriistu. On loogiline, et edukas bioinformaatik ei peaks mõistma mitte ainult bioloogiat ja keemiat, vaid ka andmeanalüüsi meetodeid, statistikat ja matemaatikat – see teeb tema elukutse üsna haruldaseks ja nõudlikuks. Selliseid spetsialiste on eriti vaja innovaatilise meditsiini ja ravimiarenduse valdkondades. Tehnikahiiglased nagu IBM ja Intel avada oma programmid, mis on pühendatud bioinformaatika uurimisele.

Mida on vaja, et saada bioinformaatikuks?

  • bioloogia ja keemia (ülikooli tase);
  • Matstat, lineaaralgebra, tõenäosusteooria;
  • Programmeerimiskeeled (Python ja R, sageli ka C++ kasutamine);
  • Struktuurse bioinformaatika jaoks: matemaatilise analüüsi ja diferentsiaalvõrrandite teooria mõistmine.

Bioinformaatika valdkonda saab astuda nii bioloogilise tausta kui ka programmeerimise ja matemaatika teadmistega. Esimesele sobib töötamine valmis bioinformaatika programmidega, teisele eriala algoritmilisem profiil.

Andmed meie sees: mida teevad bioinformaatikud?

Mida teevad bioinformaatikud?

Kaasaegne bioinformaatika jaguneb kaheks põhiharuks – struktuurseks bioinformaatikaks ja järjestusbioinformaatikaks. Esimesel juhul näeme inimest, kes istub arvuti ees ja töötab programme, mis aitavad 3D-visualisatsioonides uurida bioloogilisi objekte (näiteks DNA-d või valke). Nad ehitavad arvutimudeleid, mis võimaldavad ennustada, kuidas ravimimolekul valguga suhtleb, milline näeb välja valgu ruumiline struktuur rakus, millised molekuli omadused seletavad selle koostoimeid rakustruktuuridega jne.

Struktuurseid bioinformaatika meetodeid kasutatakse aktiivselt nii akadeemilises teaduses kui ka tööstuses: on raske ette kujutada ravimifirmat, kes saaks ilma selliste spetsialistideta hakkama. Viimastel aastatel on arvutimeetodid potentsiaalsete ravimite otsimise protsessi oluliselt lihtsustanud, muutes ravimiarenduse palju kiiremaks ja odavamaks protsessiks.

Andmed meie sees: mida teevad bioinformaatikud?
SARS-CoV-2 RNA-sõltuv RNA polümeraas (vasakul), samuti selle seos RNA dupleksiga. Allikas.

Mis on genoom?

Genoom on kogu teave organismi pärilikkuse struktuuri kohta. Peaaegu kõigil elusolenditel on genoomi kandjaks DNA, kuid leidub organisme, kes edastavad oma pärilikku teavet RNA kujul. Genoom antakse edasi vanematelt lastele ja selle ülekandeprotsessi käigus võivad tekkida vead, mida nimetatakse mutatsioonideks.

Andmed meie sees: mida teevad bioinformaatikud?
Ravimi remdesivir koostoime SARS-CoV-2 viiruse RNA-sõltuva RNA polümeraasiga. Allikas.

Järjestusbioinformaatika tegeleb elusaine kõrgema organiseerituse tasemega – alates üksikutest nukleotiididest, DNA-st ja geenidest kuni tervete genoomide ja nende omavaheliste võrdlusteni.

Kujutage ette inimest, kes näeb enda ees tähestiku tähtede komplekti (aga mitte lihtsat, vaid geneetilist või aminohappelist) ja otsib neis mustreid, selgitab ja kinnitab neid statistiliselt, kasutades arvutimeetodeid. Järjestuste bioinformaatika selgitab, milline mutatsioon on seotud konkreetse haigusega või miks kogunevad patsiendi verre kahjulikud ained. Lisaks meditsiinilistele andmetele uurivad järjestuse bioinformaatikud organismide leviku mustreid üle maa, populatsiooni erinevusi loomarühmade vahel ning konkreetsete geenide rolle ja funktsioone. Tänu sellele teadusele on võimalik testida ravimite efektiivsust ja uurida nende toimet selgitavaid bioloogilisi mehhanisme.

Näiteks leiti ja kirjeldati tänu bioinformaatika analüüsile mutatsioone, mis viisid ühe kloriidikanali geeni lagunemisest põhjustatud monogeense haiguse, tsüstilise fibroosi tekkeni. Ja nüüd teame palju paremini, kes on inimese lähim bioloogiline sugulane ja kuidas meie esivanemad planeedil elama asusid. Pealegi saab iga inimene oma genoomi lugedes teada, kust on pärit tema perekond ja millisesse rahvusrühma ta kuulub. Paljud välismaised (23andmeMyHeritage) ja vene (GenotekAtlas) teenused võimaldavad teil saada seda teenust suhteliselt madala hinnaga (umbes 20 tuhat rubla).

Andmed meie sees: mida teevad bioinformaatikud?
MyHeritage'i päritolu ja populatsiooni kuuluvuse DNA-testi analüüsi tulemused.

Andmed meie sees: mida teevad bioinformaatikud?
23andMe DNA populatsioonitesti tulemused.

Kuidas genoomi loetakse?

Tänapäeval on genoomi järjestamine rutiinne protseduur, mis maksab igaühele ligikaudu 150 tuhat rubla (sh Venemaal). Genoomi lugemiseks peate lihtsalt spetsiaalses laboris veenist vere loovutama: kahe nädala pärast saate valmis tulemuse koos teie geneetiliste omaduste üksikasjaliku kirjeldusega. Lisaks oma genoomile saad analüüsida oma soolestiku mikrobioota genoome: saad teada sinu seedesüsteemi asustavate bakterite tunnused, samuti saad nõu professionaalselt toitumisspetsialistilt.

Genoomi saab lugeda erinevate meetoditega, millest üks peamisi on praegu nn “järgmise põlvkonna sekveneerimine”. Selle protseduuri läbiviimiseks tuleb esmalt võtta bioloogilised proovid. Igal keharakul on sama genoom, nii et kõige sagedamini võetakse genoomi lugemiseks verd (see on kõige lihtsam). Seejärel rakud lagunevad ja eraldavad DNA kõigest muust. Seejärel jagatakse saadud DNA paljudeks väikesteks tükkideks ja igaühe külge "õmmeldakse" spetsiaalsed adapterid - kunstlikult sünteesitud teadaolevad nukleotiidjärjestused. Seejärel eraldatakse DNA ahelad ja üheahelalised ahelad kinnitatakse adapterite abil spetsiaalsele plaadile, millel teostatakse sekveneerimine. Sekveneerimise käigus lisatakse DNA järjestusele komplementaarsed fluorestsentsmärgistatud nukleotiidid. Iga märgistatud nukleotiid kiirgab kinnitumisel teatud lainepikkusega valguskiire, mis salvestatakse arvutisse. Nii loeb arvuti algse DNA lühikesi järjestusi, mis seejärel spetsiaalsete algoritmide abil algsesse genoomi kokku pannakse.

Andmed meie sees: mida teevad bioinformaatikud?
Näide andmetest, millega järjestuse bioinformaatikud töötavad: aminohappejärjestuse joondamine.

Kus bioinformaatikud töötavad ja kui palju nad teenivad?

Bioinformaatika tee on traditsiooniliselt jagatud kaheks põhivaldkonnaks – tööstus ja teadus. Bioinformaatikuteadlase karjäär algab tavaliselt suures instituudis lõpetades. Esialgu saavad bioinformaatikud põhipalka, mis põhineb nende instituudil, toetuste arvul, milles nad osalevad, ja nende liitude arvul - kohtadel, kus nad ametlikult töötavad. Aja jooksul stipendiumide ja liitumiste arv kasvab ning pärast umbes paariaastast akadeemilises keskkonnas töötamist saab bioinformaatik kergesti keskmist palka (70-80 tuhat rubla), kuid palju sõltub hoolsusest ja töökusest. Kõige kogenumad bioinformaatikud juhivad lõpuks oma spetsialiseerumisvaldkondades oma laboreid.

Andmed meie sees: mida teevad bioinformaatikud?

Kus sa õpid bioinformaatika erialal?

  • Moskva Riiklik Ülikool – bioinseneri ja bioinformaatika teaduskond
  • HSE – andmete analüüs bioloogias ja meditsiinis (magistriprogramm)
  • MIPT – Bioinformaatika osakond
  • Bioinformaatika instituut (NPO)

Erinevalt akadeemiast ei kuluta selles valdkonnas keegi oma aega töötajale vajalike oskuste õpetamisele, seega on sinna jõudmine tavaliselt keerulisem. Bioinformaatiku karjääritee tööstuses varieerub suuresti sõltuvalt tema erialast ja asukohast. Keskmiselt on palgad selles valdkonnas kõikuvad 70 tuhandelt 150-ni tuhat rubla, sõltuvalt kogemusest ja spetsialiseerumisest. 

Kuulsad bioinformaatikud

Bioinformaatika ajalugu võib alguse saada Frederick Sangerist, inglise teadlasest, kes sai 1980. aastal Nobeli keemiaauhinna DNA järjestuste lugemise viisi avastamise eest. Sellest ajast alates on järjestuste lugemise meetodid iga aastaga paranenud, kuid Sangeri järjestuse meetod oli kõigi selle valdkonna edasiste uuringute aluseks.

Andmed meie sees: mida teevad bioinformaatikud?

Muide, paljud Venemaa teadlaste loodud programmid on nüüdseks laialdaselt kasutusel kogu maailmas – näiteks genoomikoostaja SPAdes, - St. Peterburi Instituudis loodud Petersburgi genoomikoostaja aitab kogu maailmast pärit teadlastel kokku panna lühikesi DNA järjestusi suuremateks järjestusteks, et rekonstrueerida organismide algsed genoomid.

Bioinformaatika avastused ja saavutused

Tänapäeval teevad bioinformaatikud palju kasulikke avastusi. Koronaviiruse ravimite väljatöötamist oleks võimatu ette kujutada ilma selle genoomi dešifreerimata ja haiguse ajal toimuvate protsesside keeruka bioinformaatika analüüsita. Rahvusvaheline группа Võrdlevat genoomikat ja masinõppemeetodeid kasutavad teadlased suutsid mõista, mis on koroonaviirustel ühist teiste patogeenidega.

Selgus, et üks neist omadustest on patogeensete viiruste tuuma lokaliseerimise signaalide (NLS) tugevdamine, mis toimub evolutsiooni käigus. See uuring võib aidata uurida viirustüvesid, mis võivad tulevikus inimestele potentsiaalselt ohtlikud olla, ja võib-olla viia ennetava ravimite väljatöötamiseni. 

Lisaks on bioinformaatikud mänginud võtmerolli uute genoomi redigeerimismeetodite, eelkõige CRISPR/Cas9 süsteemi (immuunsüsteemil põhinev tehnoloogia) väljatöötamisel. bakterid). Tänu nende valkude struktuuri ja nende evolutsioonilise arengu bioinformaatikaanalüüsile on viimastel aastatel oluliselt tõusnud selle süsteemi täpsus ja efektiivsus, mis on võimaldanud sihipäraselt toimetada paljude organismide (sh inimese) genoome.

Andmed meie sees: mida teevad bioinformaatikud?
SkillFactory veebikursustel osaledes võite omandada nõutud elukutse nullist või Level Up tasemel oskuste ja palga osas:

Rohkem kursusi

Allikas: www.habr.com

Lisa kommentaar