Cov ntaub ntawv hauv peb: bioinformaticians ua dab tsi?

Cov ntaub ntawv hauv peb: bioinformaticians ua dab tsi?
Peb tab tom tham txog cov neeg ntawm lub neej yav tom ntej uas decipher cov organic loj hnub. Ob xyoo dhau los, tus nqi ntawm cov ntaub ntawv lom neeg uas tuaj yeem txheeb xyuas tau nce ntau ntxiv vim qhov sib luag ntawm tib neeg genome. Ua ntej qhov no, peb tsis tuaj yeem xav txog tias kev siv cov ntaub ntawv khaws cia hauv peb cov ntshav, nws tuaj yeem txiav txim siab peb lub hauv paus chiv keeb, xyuas seb lub cev yuav ua li cas rau qee yam tshuaj, thiab txawm hloov peb cov kab mob lom.

Qhov no thiab lwm yam khoom tshwm sim thawj zaug hauv blog xa ntawm peb lub vev xaib. Txaus siab rau kev nyeem ntawv.

Cov cwj pwm ntawm qhov nruab nrab bioinformatician yog tib yam li cov programmer - lub qhov muag liab, stooped posture thiab cov cim los ntawm khob kas fes ntawm lub desktop. Txawm li cas los xij, ntawm lub rooj no, kev ua haujlwm tsis yog nyob ntawm kev paub daws teeb meem thiab cov lus txib, tab sis ntawm cov cai ntawm qhov nws tus kheej, uas tuaj yeem qhia peb ntau yam txog peb thiab lub ntiaj teb nyob ib puag ncig peb.

Cov kws tshaj lij hauv daim teb no cuam tshuam nrog cov ntaub ntawv loj heev (piv txwv li, cov txiaj ntsig ntawm kev sib txuas cov genome ntawm ib tus neeg siv txog 100 gigabytes). Yog li ntawd, kev ua cov ntaub ntawv zoo li no yuav tsum muaj cov ntaub ntawv Science mus kom ze thiab cov cuab yeej. Nws yog qhov laj thawj uas tus kws paub txog bioinformatician ua tiav yuav tsum nkag siab tsis tsuas yog biology thiab chemistry, tab sis kuj tseem siv cov ntaub ntawv tshuaj ntsuam, txheeb cais thiab lej - qhov no ua rau nws txoj haujlwm tsis tshua muaj thiab xav tau. Xws li cov kws tshaj lij tshwj xeeb yog xav tau nyob rau hauv cov cheeb tsam ntawm cov tshuaj tshiab thiab kev tsim tshuaj. Tech giants zoo li IBM thiab Intel qhib lawv cov kev pab cuam, mob siab rau txoj kev kawm ntawm bioinformatics.

Yuav ua li cas los ua ib tug bioinformatician?

  • Biology thiab Chemistry (qib tsev kawm qib siab);
  • Matstat, linear algebra, probability theory;
  • Programming lus (Python thiab R, feem ntau kuj siv C ++);
  • Rau cov txheej txheem bioinformatics: nkag siab txog kev ua lej thiab kev xav ntawm kev sib npaug sib txawv.

Koj tuaj yeem nkag mus rau thaj chaw ntawm bioinformatics nrog ob qho tib si keeb kwm lom neeg thiab kev paub txog programming thiab lej. Rau yav dhau los, ua hauj lwm nrog npaj-ua bioinformatics cov kev pab cuam yog tsim, rau tom kawg, ib tug ntau algorithmic profile ntawm tshwj xeeb.

Cov ntaub ntawv hauv peb: bioinformaticians ua dab tsi?

bioinformaticians ua dab tsi?

Niaj hnub nimno bioinformatics tau muab faib ua ob lub ntsiab lus - cov qauv bioinformatics thiab sequence bioinformatics. Hauv thawj kis, peb pom ib tug neeg zaum pem hauv ntej ntawm lub computer thiab khiav cov kev pab cuam uas pab kawm txog cov khoom lom (piv txwv li, DNA lossis cov proteins) hauv 3D kev pom. Lawv tsim cov qauv hauv computer uas ua rau nws muaj peev xwm kwv yees li cas cov tshuaj molecule yuav cuam tshuam nrog cov protein, qhov qauv ntawm cov protein zoo li hauv lub cell, dab tsi ntawm cov molecule piav qhia nws cov kev cuam tshuam nrog cov qauv ntawm tes, thiab lwm yam.

Cov txheej txheem bioinformatics yog nquag siv ob qho tib si hauv kev kawm tshawb fawb thiab hauv kev lag luam: nws nyuaj rau xav txog lub tuam txhab tshuaj uas tuaj yeem ua yam tsis muaj cov kws tshaj lij. Nyob rau hauv xyoo tas los no, cov txheej txheem hauv computer tau yooj yim heev rau kev tshawb nrhiav cov tshuaj muaj peev xwm, ua rau kev tsim kho tshuaj sai dua thiab pheej yig dua.

Cov ntaub ntawv hauv peb: bioinformaticians ua dab tsi?
SARS-CoV-2 RNA-dependent RNA polymerase (sab laug), as well as nws koom nrog RNA duplex. Qhov chaw.

Dab tsi yog genome?

Lub genome yog tag nrho cov ntaub ntawv hais txog cov qauv ntawm cov kab mob ntawm cov kab mob. Nyob rau hauv yuav luag tag nrho cov ciaj sia, tus cab kuj ntawm genome yog DNA, tab sis muaj cov kab mob uas kis tau lawv cov ntaub ntawv keeb kwm nyob rau hauv daim ntawv ntawm RNA. Cov genome tau dhau los ntawm niam txiv mus rau cov menyuam yaus, thiab thaum lub sijhawm kis tus kabmob no, qhov yuam kev hu ua kev hloov pauv tuaj yeem tshwm sim.

Cov ntaub ntawv hauv peb: bioinformaticians ua dab tsi?
Kev sib cuam tshuam ntawm cov tshuaj remdesivir nrog RNA-dependent RNA polymerase ntawm tus kab mob SARS-CoV-2. Qhov chaw.

Sequence bioinformatics cuam tshuam nrog qib siab ntawm lub koom haum ntawm cov teeb meem nyob - los ntawm tus kheej nucleotides, DNA thiab cov noob, mus rau tag nrho cov genomes thiab lawv cov kev sib piv nrog ib leeg.

Xav txog tej yam ib tug neeg uas pom nyob rau hauv pem hauv ntej ntawm nws ib tug txheej ntawm cov tsiaj ntawv (tab sis tsis yog ib tug yooj yim, tab sis ib tug genetic los yog amino acid ib tug) thiab nrhiav cov qauv nyob rau hauv lawv, piav qhia thiab paub tseeb tias lawv statisticically, siv computer txoj kev. Sequence bioinformatics piav qhia txog qhov kev hloov pauv uas cuam tshuam nrog ib tus kab mob lossis yog vim li cas cov tshuaj tsis zoo sib sau ua ke hauv tus neeg mob cov ntshav. Ntxiv nrog rau cov ntaub ntawv kho mob, cov kws tshawb fawb bioinformatics kawm cov qauv ntawm kev faib cov kab mob thoob plaws ntiaj teb, cov pej xeem sib txawv ntawm pawg tsiaj, thiab lub luag haujlwm thiab kev ua haujlwm ntawm cov noob tshwj xeeb. Ua tsaug rau qhov kev tshawb fawb no, nws muaj peev xwm kuaj tau cov tshuaj muaj txiaj ntsig thiab kawm txog cov txheej txheem lom neeg uas piav qhia lawv qhov kev ua.

Piv txwv li, ua tsaug rau bioinformatics tsom xam, kev hloov pauv ua rau kev txhim kho cystic fibrosis, kab mob monogenic tshwm sim los ntawm kev tawg ntawm cov noob ntawm ib qho ntawm cov tshuaj chloride, tau pom thiab piav qhia. Thiab tam sim no peb paub zoo dua tias leej twg yog tus txheeb ze ze tshaj plaws ntawm tus txiv neej thiab peb cov poj koob yawm txwv nyob ib puag ncig lub ntiaj teb li cas. Ntxiv mus, txhua tus neeg, los ntawm kev nyeem nws cov genome, tuaj yeem paub qhov twg nws tsev neeg tuaj ntawm thiab haiv neeg twg nws koom nrog. Ntau tus neeg txawv teb chaws (23e pemMyHeritage) thiab Russian (GenotekAtlas) cov kev pabcuam tso cai rau koj kom tau txais cov kev pabcuam no rau tus nqi qis (kwv yees li 20 txhiab rubles).

Cov ntaub ntawv hauv peb: bioinformaticians ua dab tsi?
Cov txiaj ntsig ntawm kev ntsuam xyuas DNA rau keeb kwm thiab cov pej xeem koom nrog los ntawm MyHeritage.

Cov ntaub ntawv hauv peb: bioinformaticians ua dab tsi?
Cov txiaj ntsig ntawm kev kuaj DNA pej xeem los ntawm 23andMe.

Lub genome nyeem li cas?

Niaj hnub no, genome sequencing yog cov txheej txheem niaj hnub uas yuav raug nqi txhua tus kwv yees 150 txhiab rubles (xws li nyob rau hauv Russia). Txhawm rau nyeem koj cov genome, koj tsuas yog yuav tsum pub ntshav los ntawm cov hlab ntsha hauv chav kuaj tshwj xeeb: hauv ob lub lis piam koj yuav tau txais cov txiaj ntsig tiav nrog cov lus piav qhia ntxaws txog koj cov yam ntxwv ntawm caj ces. Ntxiv nrog rau koj cov genome, koj tuaj yeem txheeb xyuas cov genomes ntawm koj cov hnyuv microbiota: koj yuav kawm cov yam ntxwv ntawm cov kab mob uas nyob hauv koj lub plab zom mov, thiab tseem tau txais cov lus qhia los ntawm kws tshaj lij kev noj zaub mov.

Lub genome tuaj yeem nyeem tau siv ntau txoj hauv kev, ib qho ntawm cov tseem ceeb tam sim no yog qhov hu ua "tom ntej tiam sequencing". Txhawm rau ua qhov txheej txheem no, cov qauv tshuaj lom neeg yuav tsum tau ua ntej. Txhua lub cell ntawm lub cev muaj tib lub genome, yog li feem ntau cov ntshav raug coj los nyeem cov genome (qhov no yog qhov yooj yim tshaj). Cov hlwb ces tawg thiab cais DNA ntawm txhua yam. Tom qab ntawd, DNA qhov tshwm sim tau muab faib ua ntau daim me me thiab cov khoom siv tshwj xeeb yog "sewn" rau txhua tus ntawm lawv - cov khoom sib txuas uas paub txog nucleotide sequences. Tom qab ntawd cov DNA strands raug sib cais, thiab ib leeg-stranded strands txuas nrog siv adapters rau lub phaj tshwj xeeb uas ua raws li cov txheej txheem. Thaum lub sij hawm sequencing, complementary fluorescently sau npe nucleotides tau ntxiv rau DNA sequence. Txhua daim ntawv sau npe nucleotide, thaum txuas nrog, emits ib lub teeb ntawm lub teeb ntawm qee qhov wavelength, uas tau kaw rau hauv lub computer. Qhov no yog li cas lub computer nyeem luv luv sequences ntawm thawj DNA, uas yog ces sib sau ua ke rau hauv thawj genome siv tshwj xeeb algorithms.

Cov ntaub ntawv hauv peb: bioinformaticians ua dab tsi?
Ib qho piv txwv ntawm cov ntaub ntawv uas sequence bioinformaticians ua haujlwm nrog: amino acid sequence alignment .

bioinformaticians ua haujlwm nyob qhov twg thiab lawv khwv tau npaum li cas?

Txoj kev bioinformatics ib txwm muab faib ua ob qhov tseem ceeb - kev lag luam thiab kev tshawb fawb. Ib txoj haujlwm ua tus kws tshawb fawb bioinformatics feem ntau pib nrog txoj haujlwm kawm tiav ntawm lub koom haum loj. Thaum pib, bioinformaticians tau txais cov nyiaj hli nruab nrab raws li lawv lub koom haum, cov nyiaj pab uas lawv koom nrog, thiab lawv cov kev koom tes - cov chaw uas lawv tau ua haujlwm. Sij hawm dhau mus, cov nyiaj pab thiab kev koom tes loj hlob tuaj, thiab tom qab li ob peb xyoos ntawm kev ua haujlwm hauv ib puag ncig kev kawm, tus kws paub txog bioinformatic tau yooj yim tau txais cov nyiaj hli nruab nrab (70-80 txhiab rubles), tab sis ntau nyob ntawm kev mob siab thiab ua haujlwm hnyav. Cov kws paub txog bioinformaticians feem ntau xaus rau kev khiav lawv tus kheej lub chaw sim hauv lawv qhov chaw tshwj xeeb.

Cov ntaub ntawv hauv peb: bioinformaticians ua dab tsi?

Koj kawm txog bioinformatics qhov twg?

  • Moscow State University - Kws qhia ntawv ntawm Bioengineering thiab Bioinformatics
  • HSE - Kev Ntsuam Xyuas Cov Ntaub Ntawv hauv Biology thiab Tshuaj (Master's program)
  • MIPT - Department of Bioinformatics
  • Institute of Bioinformatics (NPO)

Tsis zoo li lub tsev kawm ntawv, tsis muaj leej twg hauv kev lag luam yuav siv lawv lub sijhawm qhia tus neeg ua haujlwm txog kev txawj ntse, yog li kev mus rau qhov ntawd yog qhov nyuaj dua. Txoj kev ua haujlwm ntawm bioinformatician hauv kev lag luam txawv heev nyob ntawm lawv qhov tshwj xeeb thiab qhov chaw. Qhov nruab nrab, cov nyiaj hli hauv daim teb no hloov pauv los ntawm 70 txhiab mus rau 150 txhiab rubles, nyob ntawm kev paub thiab kev tshwj xeeb. 

Nto moo bioinformaticians

Cov keeb kwm ntawm bioinformatics tuaj yeem taug qab mus rau Frederick Sanger, tus kws tshawb fawb Askiv uas tau txais Nobel nqi zog hauv Chemistry hauv xyoo 1980 rau nws qhov kev tshawb pom ntawm txoj hauv kev los nyeem DNA ua ntu zus. Txij thaum ntawd los, cov txheej txheem nyeem cov kab ke tau txhim kho txhua xyoo, tab sis txoj kev "Sanger sequencing" tau ua lub hauv paus rau txhua qhov kev tshawb fawb ntxiv hauv cheeb tsam no.

Cov ntaub ntawv hauv peb: bioinformaticians ua dab tsi?

Los ntawm txoj kev, ntau cov kev pab cuam tsim los ntawm Lavxias teb sab kws tshawb fawb yog tam sim no dav siv thoob plaws lub ntiaj teb no - piv txwv li, lub genome assembler. SPAdes, - St. Petersburg genome assembler, tsim nyob rau hauv St. Petersburg lub koom haum, pab cov kws tshawb fawb los ntawm thoob plaws lub ntiaj teb no sib sau ua ke luv DNA sequences rau hauv loj sequences rau reconstruct lub qub genomes ntawm cov kab mob.

Discoveries thiab achievements ntawm bioinformatics

Niaj hnub no, bioinformaticians ua ntau qhov kev tshawb pom muaj txiaj ntsig. Nws yuav tsis yooj yim sua kom xav txog kev txhim kho cov tshuaj rau tus mob coronavirus yam tsis tau txiav txim siab nws cov genome thiab kev tshawb fawb bioinformatics nyuaj ntawm cov txheej txheem tshwm sim thaum muaj tus kab mob. Thoob ntiaj teb cov pab pawg Cov kws tshawb fawb siv cov kev sib piv genomics thiab kev kawm tshuab tau nkag siab tias tus mob coronaviruses muaj li cas nrog rau lwm cov kab mob.

Nws tau muab tawm tias ib qho ntawm cov yam ntxwv no yog kev ntxiv dag zog rau cov teeb liab hauv cheeb tsam nuclear (NLS) ntawm cov kab mob pathogenic uas tshwm sim thaum hloov pauv. Qhov kev tshawb fawb no tuaj yeem pab tshawb nrhiav cov kab mob uas tuaj yeem ua rau muaj kev phom sij rau tib neeg yav tom ntej, thiab tej zaum yuav ua rau muaj kev tiv thaiv tshuaj tiv thaiv. 

Tsis tas li ntawd, bioinformaticians tau ua lub luag haujlwm tseem ceeb hauv kev txhim kho genome kho cov txheej txheem tshiab, tshwj xeeb tshaj yog CRISPR / Cas9 system (kev siv tshuab raws li kev tiv thaiv kab mob. cov kab mob). Ua tsaug rau bioinformatics tsom xam ntawm cov qauv ntawm cov proteins thiab lawv cov evolutionary txoj kev loj hlob, qhov tseeb thiab efficiency ntawm no system tau nce loj nyob rau hauv xyoo tas los no, uas tau ua kom lub hom phiaj kho cov genomes ntawm ntau yam kab mob (xws li tib neeg).

Cov ntaub ntawv hauv peb: bioinformaticians ua dab tsi?
Koj tuaj yeem tau txais kev nrhiav haujlwm tom qab los ntawm kos lossis Qib Up ntawm kev txawj thiab nyiaj hli los ntawm kev kawm SkillFactory hauv online:

Cov chav kawm ntxiv

Tau qhov twg los: www.hab.com

Ntxiv ib saib