Data sa loob natin: Ano ang ginagawa ng mga bioinformatician?

Data sa loob natin: Ano ang ginagawa ng mga bioinformatician?
Pinag-uusapan natin ang tungkol sa mga tao sa hinaharap na nag-decipher ng organic na malaking petsa. Sa nakalipas na dalawang dekada, ang dami ng biological data na maaaring masuri ay tumaas ng maraming beses dahil sa pagkakasunud-sunod ng genome ng tao. Bago ito, hindi natin maisip na ang paggamit ng impormasyong literal na nakaimbak sa ating dugo, posible na matukoy ang ating pinagmulan, suriin kung ano ang magiging reaksyon ng katawan sa ilang mga gamot, at kahit na baguhin ang ating biological heredity.

Ito at ang iba pang mga artikulo ay unang lumabas sa post ng blog sa aming website. Enjoy reading.

Ang mga katangian ng karaniwang bioinformatician ay kapareho ng sa isang programmer - pulang mata, nakayuko na postura at mga marka mula sa mga tasa ng kape sa desktop. Gayunpaman, sa talahanayang ito ang gawain ay hindi sa abstract algorithm at command, ngunit sa code ng kalikasan mismo, na maaaring sabihin sa amin ng maraming tungkol sa amin at sa mundo sa paligid natin.

Ang mga espesyalista sa larangang ito ay nakikitungo sa malaking halaga ng data (halimbawa, ang mga resulta ng pagkakasunud-sunod ng genome ng isang tao ay tumatagal ng humigit-kumulang 100 gigabytes). Samakatuwid, ang pagproseso ng naturang hanay ng impormasyon ay nangangailangan ng mga diskarte at tool sa Data Science. Ito ay lohikal na ang isang matagumpay na bioinformatician ay dapat maunawaan hindi lamang ang biology at chemistry, kundi pati na rin ang mga pamamaraan ng pagsusuri ng data, istatistika at matematika - ito ay ginagawang medyo bihira at hinihiling ang kanyang propesyon. Ang ganitong mga espesyalista ay lalo na kailangan sa mga lugar ng makabagong gamot at pagpapaunlad ng gamot. Mga higanteng teknolohiya tulad ng IBM at Intel buksan ang kanilang mga programa, na nakatuon sa pag-aaral ng bioinformatics.

Ano ang kinakailangan upang maging isang bioinformatician?

  • Biology at Chemistry (antas ng unibersidad);
  • Matstat, linear algebra, probability theory;
  • Mga wika sa programming (Python at R, kadalasang gumagamit din ng C++);
  • Para sa structural bioinformatics: pag-unawa sa mathematical analysis at theory of differential equation.

Maaari kang pumasok sa larangan ng bioinformatics na may parehong biological background at kaalaman sa programming at matematika. Para sa una, ang pagtatrabaho sa mga handa na bioinformatics na mga programa ay angkop, para sa huli, isang mas algorithmic na profile ng espesyalidad.

Data sa loob natin: Ano ang ginagawa ng mga bioinformatician?

Ano ang ginagawa ng mga bioinformatician?

Ang modernong bioinformatics ay nahahati sa dalawang pangunahing sangay - structural bioinformatics at sequence bioinformatics. Sa unang kaso, nakikita namin ang isang tao na nakaupo sa harap ng isang computer at nagpapatakbo ng mga program na tumutulong sa pag-aaral ng mga biological na bagay (halimbawa, DNA o mga protina) sa mga 3D visualization. Bumubuo sila ng mga modelo ng computer na ginagawang posible upang mahulaan kung paano makikipag-ugnayan ang isang molekula ng gamot sa isang protina, kung ano ang hitsura ng spatial na istraktura ng isang protina sa isang cell, kung anong mga katangian ng molekula ang nagpapaliwanag ng mga pakikipag-ugnayan nito sa mga istruktura ng cellular, atbp.

Ang mga pamamaraan ng istrukturang bioinformatics ay aktibong ginagamit kapwa sa agham pang-akademiko at sa industriya: mahirap isipin ang isang kumpanya ng parmasyutiko na magagawa nang walang mga naturang espesyalista. Sa mga nagdaang taon, ang mga pamamaraan ng computer ay lubos na pinasimple ang proseso ng paghahanap ng mga potensyal na gamot, na ginagawang mas mabilis at mas murang proseso ang pagpapaunlad ng parmasyutiko.

Data sa loob natin: Ano ang ginagawa ng mga bioinformatician?
SARS-CoV-2 RNA-dependent RNA polymerase (kaliwa), pati na rin ang kaugnayan nito sa RNA duplex. Pinagmulan.

Ano ang isang genome?

Ang genome ay ang lahat ng impormasyon tungkol sa istruktura ng pagmamana ng isang organismo. Sa halos lahat ng nabubuhay na nilalang, ang carrier ng genome ay DNA, ngunit may mga organismo na nagpapadala ng kanilang namamana na impormasyon sa anyo ng RNA. Ang genome ay ipinapasa mula sa mga magulang patungo sa mga bata, at sa panahon ng proseso ng paghahatid na ito, ang mga error na tinatawag na mutations ay maaaring mangyari.

Data sa loob natin: Ano ang ginagawa ng mga bioinformatician?
Pakikipag-ugnayan ng gamot na remdesivir sa RNA-dependent na RNA polymerase ng SARS-CoV-2 virus. Pinagmulan.

Ang sequence bioinformatics ay tumatalakay sa mas mataas na antas ng organisasyon ng buhay na bagay - mula sa mga indibidwal na nucleotides, DNA at mga gene, hanggang sa buong genome at ang kanilang mga paghahambing sa isa't isa.

Isipin ang isang tao na nakikita sa harap niya ang isang hanay ng mga titik ng alpabeto (ngunit hindi isang simple, ngunit isang genetic o amino acid) at naghahanap ng mga pattern sa mga ito, na nagpapaliwanag at nagpapatunay sa mga ito sa istatistika, gamit ang mga pamamaraan ng computer. Ipinapaliwanag ng sequence bioinformatics kung aling mutation ang nauugnay sa isang partikular na sakit o kung bakit naiipon ang mga nakakapinsalang substance sa dugo ng isang pasyente. Bilang karagdagan sa medikal na data, pinag-aaralan ng mga sequence bioinformatician ang mga pattern ng pamamahagi ng mga organismo sa buong mundo, mga pagkakaiba ng populasyon sa pagitan ng mga pangkat ng mga hayop, at ang mga tungkulin at tungkulin ng mga partikular na gene. Salamat sa agham na ito, posible na subukan ang pagiging epektibo ng mga gamot at pag-aralan ang mga biological na mekanismo na nagpapaliwanag ng kanilang pagkilos.

Halimbawa, salamat sa pagsusuri ng bioinformatics, natagpuan at inilarawan ang mga mutasyon na humahantong sa pagbuo ng cystic fibrosis, isang sakit na monogenic na sanhi ng pagkasira ng gene ng isa sa mga channel ng chloride. At ngayon mas alam na natin kung sino ang pinakamalapit na biyolohikal na kamag-anak ng tao at kung paano nanirahan ang ating mga ninuno sa buong planeta. Bukod dito, ang bawat tao, sa pamamagitan ng pagbabasa ng kanyang genome, ay maaaring malaman kung saan nagmula ang kanyang pamilya at kung anong etnikong grupo siya kabilang. Maraming dayuhan (23andmeMyHeritage) at Ruso (GenotekAtlas) mga serbisyo ay nagbibigay-daan sa iyo upang makuha ang serbisyong ito para sa isang medyo mababang presyo (mga 20 libong rubles).

Data sa loob natin: Ano ang ginagawa ng mga bioinformatician?
Mga resulta ng pagsusuri sa DNA test para sa pinanggalingan at kaakibat ng populasyon mula sa MyHeritage.

Data sa loob natin: Ano ang ginagawa ng mga bioinformatician?
Mga resulta ng pagsusuri sa populasyon ng DNA mula sa 23andMe.

Paano binabasa ang genome?

Ngayon, ang genome sequencing ay isang nakagawiang pamamaraan na humigit-kumulang na gagastos ng sinuman 150 libong rubles (kabilang ang Russia). Upang basahin ang iyong genome, kailangan mo lamang na mag-abuloy ng dugo mula sa isang ugat sa isang espesyal na laboratoryo: sa loob ng dalawang linggo makakatanggap ka ng isang natapos na resulta na may isang detalyadong paglalarawan ng iyong mga genetic na katangian. Bilang karagdagan sa iyong genome, maaari mong pag-aralan ang mga genome ng iyong bituka microbiota: malalaman mo ang mga katangian ng bakterya na naninirahan sa iyong digestive system, at makakatanggap din ng payo mula sa isang propesyonal na nutrisyonista.

Maaaring basahin ang genome gamit ang iba't ibang pamamaraan, isa sa mga pangunahing ngayon ay ang tinatawag na "next generation sequencing". Upang maisagawa ang pamamaraang ito, kailangan munang kumuha ng mga biological sample. Ang bawat cell ng katawan ay may parehong genome, kaya kadalasang kumukuha ng dugo para basahin ang genome (ito ang pinakamadali). Ang mga cell pagkatapos ay masira at ihiwalay ang DNA mula sa lahat ng iba pa. Pagkatapos, ang resultang DNA ay nahahati sa maraming maliliit na piraso at ang mga espesyal na adaptor ay "tinahi" sa bawat isa sa kanila - artipisyal na na-synthesize na mga kilalang nucleotide sequence. Pagkatapos ay pinaghihiwalay ang mga strand ng DNA, at ang mga single-stranded strand ay nakakabit gamit ang mga adapter sa isang espesyal na plato kung saan isinasagawa ang pagkakasunud-sunod. Sa panahon ng sequencing, ang mga pantulong na fluorescently na may label na mga nucleotide ay idinaragdag sa pagkakasunud-sunod ng DNA. Ang bawat may label na nucleotide, kapag nakakabit, ay naglalabas ng sinag ng liwanag ng isang tiyak na wavelength, na naitala sa computer. Ito ay kung paano binabasa ng computer ang mga maikling pagkakasunud-sunod ng orihinal na DNA, na pagkatapos ay tipunin sa orihinal na genome gamit ang mga espesyal na algorithm.

Data sa loob natin: Ano ang ginagawa ng mga bioinformatician?
Isang halimbawa ng data kung saan gumagana ang mga bioinformatician ng pagkakasunud-sunod: pagkakahanay ng pagkakasunud-sunod ng amino acid.

Saan nagtatrabaho ang mga bioinformatician at magkano ang kanilang kinikita?

Ang bioinformatics path ay tradisyonal na nahahati sa dalawang pangunahing lugarβ€”industriya at agham. Ang isang karera bilang isang bioinformatics scientist ay karaniwang nagsisimula sa isang graduate na posisyon sa isang pangunahing institute. Sa una, ang mga bioinformatician ay tumatanggap ng batayang suweldo batay sa kanilang instituto, ang bilang ng mga gawad na kanilang nilalahukan, at ang kanilang bilang ng mga kaakibatβ€”mga lugar kung saan sila pormal na nagtatrabaho. Sa paglipas ng panahon, ang bilang ng mga gawad at kaakibat ay lumalaki, at pagkatapos ng halos ilang taon ng pagtatrabaho sa isang akademikong kapaligiran, ang isang bioinformatician ay madaling tumatanggap ng isang average na suweldo (70-80 libong rubles), ngunit marami ang nakasalalay sa kasipagan at pagsusumikap. Ang pinaka may karanasan na mga bioinformatician ay nagpapatakbo ng kanilang sariling mga lab sa kanilang mga lugar ng espesyalisasyon.

Data sa loob natin: Ano ang ginagawa ng mga bioinformatician?

Saan ka nag-aaral para sa bioinformatics?

  • Moscow State University - Faculty ng Bioengineering at Bioinformatics
  • HSE - Pagsusuri ng Data sa Biology at Medisina (programa ng Master)
  • MIPT - Kagawaran ng Bioinformatics
  • Institute of Bioinformatics (NPO)

Hindi tulad ng isang akademya, walang sinuman sa industriya ang gumugol ng kanilang oras sa pagtuturo sa isang empleyado ng mga kinakailangang kasanayan, kaya kadalasang mas mahirap ang pagpunta doon. Ang landas ng karera ng isang bioinformatician sa industriya ay lubos na nag-iiba depende sa kanilang espesyalisasyon at lokasyon. Sa karaniwan, ang mga suweldo sa larangang ito ay nagbabago mula 70 libo hanggang 150 libong rubles, depende sa karanasan at pagdadalubhasa. 

Mga sikat na bioinformatician

Ang kasaysayan ng bioinformatics ay maaaring masubaybayan pabalik kay Frederick Sanger, isang Ingles na siyentipiko na nakatanggap ng Nobel Prize sa Chemistry noong 1980 para sa kanyang pagtuklas ng isang paraan upang basahin ang mga sequence ng DNA. Simula noon, ang mga pamamaraan ng pagbabasa ng pagkakasunud-sunod ay bumuti bawat taon, ngunit ang pamamaraang "Pagkasunod-sunod ng Sanger" ay nagsilbing batayan para sa lahat ng karagdagang pananaliksik sa lugar na ito.

Data sa loob natin: Ano ang ginagawa ng mga bioinformatician?

Sa pamamagitan ng paraan, maraming mga programa na nilikha ng mga siyentipikong Ruso ay malawak na ginagamit ngayon sa buong mundo - halimbawa, ang genome assembler SPAdes, - St. Petersburg genome assembler, na nilikha sa St. Petersburg Institute, ay tumutulong sa mga siyentipiko mula sa buong mundo na tipunin ang mga maiikling DNA sequence sa mas malalaking sequence upang muling buuin ang orihinal na genome ng mga organismo.

Mga pagtuklas at tagumpay ng bioinformatics

Sa ngayon, ang mga bioinformatician ay gumagawa ng maraming kapaki-pakinabang na pagtuklas. Imposibleng isipin ang pagbuo ng mga gamot para sa coronavirus nang hindi na-decipher ang genome at kumplikadong pagsusuri ng bioinformatics ng mga prosesong nagaganap sa panahon ng sakit. Internasyonal Π³Ρ€ΡƒΠΏΠΏΠ° Naunawaan ng mga siyentipiko na gumagamit ng comparative genomics at machine learning na paraan kung ano ang pagkakatulad ng mga coronavirus sa iba pang mga pathogen.

Ito ay lumabas na ang isa sa mga tampok na ito ay ang pagpapalakas ng mga nuclear localization signal (NLS) ng mga pathogenic virus na nangyayari sa panahon ng ebolusyon. Ang pananaliksik na ito ay maaaring makatulong sa pag-aaral ng mga strain ng mga virus na maaaring potensyal na mapanganib sa mga tao sa hinaharap, at maaaring humantong sa pag-iwas sa pagbuo ng gamot. 

Bilang karagdagan, ang mga bioinformatician ay may mahalagang papel sa pagbuo ng mga bagong pamamaraan ng pag-edit ng genome, lalo na ang CRISPR/Cas9 system (isang teknolohiyang batay sa immune system. bakterya). Salamat sa pagsusuri ng bioinformatics ng istraktura ng mga protina na ito at ang kanilang ebolusyonaryong pag-unlad, ang katumpakan at kahusayan ng sistemang ito ay tumaas nang malaki sa mga nakaraang taon, na naging posible na sinasadyang i-edit ang mga genome ng maraming mga organismo (kabilang ang mga tao).

Data sa loob natin: Ano ang ginagawa ng mga bioinformatician?
Maaari kang makakuha ng hinahanap na propesyon mula sa simula o Level Up sa mga tuntunin ng mga kasanayan at suweldo sa pamamagitan ng pagkuha ng mga online na kurso sa SkillFactory:

Higit pang mga kurso

Pinagmulan: www.habr.com

Magdagdag ng komento