Біз органикалық үлкен күнді шешетін болашақ адамдар туралы айтып отырмыз. Соңғы екі онжылдықта талдауға болатын биологиялық деректердің саны адам геномының реттілігіне байланысты бірнеше есе өсті. Бұған дейін қанымызда сақталған ақпаратты пайдалана отырып, біздің шығу тегімізді анықтауға, ағзаның кейбір дәрілерге қалай әрекет ететінін тексеруге, тіпті биологиялық тұқым қуалаушылықты өзгертуге болатынын елестете де алмадық.
Осы және басқа мақалалар бірінші болып шығады біздің веб-сайтта. Оқудан ләззат алыңыз.
Орташа биоинформатиктің атрибуттары бағдарламашыныкімен бірдей - қызыл көздер, еңкейген қалпы және жұмыс үстеліндегі кофе шыныаяқтарындағы белгілер. Дегенмен, бұл кестеде жұмыс абстрактілі алгоритмдер мен командалар бойынша емес, біз және бізді қоршаған әлем туралы көп нәрсені айта алатын табиғаттың кодында.
Бұл саланың мамандары деректердің үлкен көлемімен айналысады (мысалы, бір адамның геномын секвенирлеу нәтижелері шамамен 100 гигабайтты алады). Сондықтан мұндай ақпарат массивін өңдеу Data Science тәсілдері мен құралдарын қажет етеді. Табысты биоинформатик тек биология мен химияны ғана емес, сонымен қатар деректерді талдау әдістерін, статистика мен математиканы түсінуі керек - бұл оның мамандығын өте сирек және сұранысқа ие етеді. Мұндай мамандар әсіресе инновациялық медицина мен дәрі-дәрмек жасау салаларына қажет. IBM және Intel сияқты технологиялық алыптар , биоинформатиканы зерттеуге арналған.
Биоинформатик болу үшін не қажет?
- Биология және химия (университет деңгейі);
- Матстат, сызықтық алгебра, ықтималдықтар теориясы;
- Бағдарламалау тілдері (Python және R, көбінесе C++ қолданады);
- Құрылымдық биоинформатика үшін: математикалық талдауды және дифференциалдық теңдеулер теориясын түсіну.
Сіз биоинформатика саласына биологиялық біліммен де, бағдарламалау мен математикадан да біліммен кіре аласыз. Біріншілері үшін дайын биоинформатика бағдарламаларымен жұмыс істеу, екіншісі үшін мамандықтың неғұрлым алгоритмдік профилі қолайлы.

Биоинформатиктер не істейді?
Қазіргі биоинформатика екі негізгі салаға бөлінеді – құрылымдық биоинформатика және тізбекті биоинформатика. Бірінші жағдайда біз компьютердің алдында отырған және 3D визуализациясында биологиялық объектілерді (мысалы, ДНҚ немесе ақуыздар) зерттеуге көмектесетін бағдарламаларды іске қосып жатқан адамды көреміз. Олар компьютерлік модельдер құрастырады, олар дәрілік молекуланың ақуызбен әрекеттесетінін болжауға мүмкіндік береді, ақуыздың кеңістіктік құрылымы жасушада қандай болады, молекуланың қандай қасиеттері оның жасушалық құрылымдармен әрекеттесуін түсіндіреді және т.б.
Құрылымдық биоинформатика әдістері академиялық ғылымда да, өндірісте де белсенді қолданылады: мұндай мамандарсыз жұмыс істей алатын фармацевтикалық компанияны елестету қиын. Соңғы жылдары компьютерлік әдістер әлеуетті препараттарды табу процесін айтарлықтай жеңілдетіп, фармацевтикалық дамуды анағұрлым жылдам әрі арзан процеске айналдырды.

SARS-CoV-2 РНҚ-тәуелді РНҚ полимераза (сол жақта), сондай-ақ оның РНҚ дуплексімен байланысы.
Геном дегеніміз не?
Геном - бұл организмнің тұқым қуалаушылық құрылымы туралы барлық ақпарат. Барлық дерлік тірі тіршілік иелерінде геномның тасымалдаушысы ДНҚ болып табылады, бірақ олардың тұқым қуалау ақпаратын РНҚ түрінде тасымалдайтын организмдер бар. Геном ата-анадан балаларға беріледі және осы берілу процесінде мутация деп аталатын қателер пайда болуы мүмкін.

Ремдесивир препаратының SARS-CoV-2 вирусының РНҚ-тәуелді РНҚ полимеразасымен әрекеттесуі.
Тізбектік биоинформатика тірі материяның ұйымдасуының жоғары деңгейімен – жеке нуклеотидтерден, ДНҚ мен гендерден бастап тұтас геномдарға дейін және оларды бір-бірімен салыстырумен айналысады.
Алдынан әліпбидегі әріптер жинағын (бірақ қарапайым емес, генетикалық немесе аминқышқылды) көріп, компьютерлік әдістерді қолдана отырып, оларды статистикалық түрде түсіндіретін және растайтын үлгілерді іздейтін адамды елестетіп көріңіз. Кезекті биоинформатика қандай мутацияның белгілі бір аурумен байланысты екенін немесе науқастың қанында зиянды заттардың неліктен жиналатынын түсіндіреді. Медициналық деректерден басқа, биоинформатиктер жер бетіндегі организмдердің таралу заңдылықтарын, жануарлар топтары арасындағы популяциялық айырмашылықтарды және нақты гендердің рөлдері мен функцияларын зерттейді. Осы ғылымның арқасында дәрілік заттардың тиімділігін тексеруге және олардың әрекетін түсіндіретін биологиялық механизмдерді зерттеуге болады.
Мысалы, биоинформатикалық талдаудың арқасында хлоридтік арналардың бірінің генінің бұзылуынан болатын моногенді ауру – муковисцидоздың дамуына әкелетін мутациялар табылып, сипатталған. Ал енді біз адамның ең жақын биологиялық туысы кім екенін және біздің ата-бабаларымыздың планетаны қалай қоныстанғанын жақсы білеміз. Оның үстіне әрбір адам өзінің геномын оқу арқылы өзінің отбасының қайдан шыққанын және қай ұлтқа жататынын біле алады. Көптеген шетелдік (, ) және орысша (, ) қызметтер осы қызметті салыстырмалы түрде төмен бағаға (шамамен 20 мың рубль) алуға мүмкіндік береді.

MyHeritage сайтынан шыққан тегі мен популяциясына қатысты ДНҚ сынақ талдауының нәтижелері.

ДНҚ популяциясы сынағының нәтижелері 23andMe.
Геном қалай оқылады?
Бүгінгі күні геномды секвенирлеу - бұл шамамен кез келген адамға қымбат тұратын әдеттегі процедура мың рубль (соның ішінде Ресейде). Сіздің геномыңызды оқу үшін сізге арнайы зертханада тамырдан қан тапсыру жеткілікті: екі аптадан кейін сіз өзіңіздің генетикалық сипаттамаларыңыздың толық сипаттамасы бар дайын нәтиже аласыз. Сіздің геномыңыздан басқа, сіз ішек микробиотасының геномдарын талдай аласыз: сіз ас қорыту жүйесінде өмір сүретін бактериялардың сипаттамаларын білесіз, сонымен қатар кәсіби диетологтан кеңес аласыз.
Геномды әртүрлі әдістер арқылы оқуға болады, қазіргі кездегі негізгілерінің бірі «келесі ұрпақ секвенциясы» деп аталады. Бұл процедураны орындау үшін алдымен биологиялық үлгілерді алу керек. Дененің әрбір жасушасы бірдей геномға ие, сондықтан көбінесе геномды оқу үшін қан алынады (бұл ең оңай). Содан кейін жасушалар ыдырап, ДНҚ-ны барлық басқалардан бөледі. Содан кейін алынған ДНҚ көптеген ұсақ бөліктерге бөлінеді және олардың әрқайсысына арнайы адаптерлер «тігіледі» - жасанды түрде синтезделген белгілі нуклеотидтер тізбегі. Содан кейін ДНҚ жіптері бөлінеді, ал бір тізбекті жіптер адаптерлердің көмегімен секвенирлеу жүргізілетін арнайы пластинаға бекітіледі. Тізбектеу кезінде ДНҚ тізбегіне комплементарлы флуоресцентті таңбаланған нуклеотидтер қосылады. Әрбір таңбаланған нуклеотид қосылған кезде белгілі бір толқын ұзындығындағы жарық сәулесін шығарады, ол компьютерде жазылады. Компьютер бастапқы ДНҚ-ның қысқа тізбегін осылай оқиды, содан кейін олар арнайы алгоритмдер арқылы бастапқы геномға жиналады.

Биоинформатиктер жұмыс істейтін дәйекті деректердің мысалы: аминқышқылдарының реттілігін теңестіру.
Биоинформатиктер қайда жұмыс істейді және қанша жалақы алады?
Биоинформатика жолы дәстүрлі түрде екі негізгі салаға бөлінеді — өнеркәсіп және ғылым. Биоинформатика ғалымы ретіндегі мансап әдетте ірі институттағы магистратурадан басталады. Бастапқыда биоинформатиктер өздерінің институтына, олар қатысатын гранттар санына және олардың ресми түрде жұмыс істейтін филиалдарының санына байланысты базалық жалақы алады. Уақыт өте келе гранттар мен серіктестіктердің саны артып келеді және академиялық ортада шамамен екі жыл жұмыс істегеннен кейін биоинформатик орташа жалақыны (70-80 мың рубль) оңай алады, бірақ көп нәрсе еңбекқорлық пен еңбекқорлыққа байланысты. Ең тәжірибелі биоинформатиктер өздерінің мамандықтары бойынша жеке зертханаларын жүргізеді.

Сіз биоинформатика бойынша қайда оқисыз?
- Мәскеу мемлекеттік университеті - биоинженерия және биоинформатика факультеті
- HSE - Биология және медицинадағы деректерді талдау (магистратура)
- MIPT – биоинформатика кафедрасы
- Биоинформатика институты (NPO)
Академиядан айырмашылығы, саладағы ешкім өз уақытын қызметкерге қажетті дағдыларды үйретуге жұмсамайды, сондықтан оған жету әдетте қиынырақ. Өнеркәсіптегі биоинформатиктің мансап жолы олардың мамандығы мен орналасуына байланысты айтарлықтай өзгереді. Орташа алғанда, бұл саладағы жалақы өзгеріп отырады мың рубль, тәжірибе мен мамандандыруға байланысты.
Атақты биоинформатиктер
Биоинформатиканың тарихын ДНҚ тізбегін оқу тәсілін ашқаны үшін 1980 жылы химия бойынша Нобель сыйлығын алған ағылшын ғалымы Фредерик Сэнгерден бастауға болады. Содан бері реттілікпен оқу әдістері жыл сайын жетілдірілді, бірақ «Сэнджер реттілігі» әдісі осы саладағы барлық кейінгі зерттеулерге негіз болды.

Айтпақшы, ресейлік ғалымдар жасаған көптеген бағдарламалар қазір бүкіл әлемде кеңінен қолданылады - мысалы, геномды ассемблер , - St. Санкт-Петербург институтында жасалған Петербург геномының ассемблері бүкіл әлем ғалымдарына организмдердің бастапқы геномдарын қайта құру үшін қысқа ДНҚ тізбегін үлкенірек тізбектерге жинауға көмектеседі.
Биоинформатиканың ашылулары мен жетістіктері
Қазіргі уақытта биоинформатиктер көптеген пайдалы жаңалықтар ашады. Коронавирусқа қарсы препараттардың дамуын оның геномынсыз және ауру кезінде болатын процестерге кешенді биоинформатикалық талдаусыз елестету мүмкін емес еді. Халықаралық Салыстырмалы геномиканы және машиналық оқыту әдістерін қолданатын ғалымдар коронавирустардың басқа қоздырғыштармен қандай ортақтығы бар екенін түсіне алды.
Бұл ерекшеліктердің бірі эволюция кезінде пайда болатын патогенді вирустардың ядролық локализация сигналдарының (NLS) күшеюі болып шықты. Бұл зерттеу болашақта адамдар үшін қауіпті болуы мүмкін вирустардың штаммдарын зерттеуге көмектесуі мүмкін және, мүмкін, алдын-алу препараттарының дамуына әкелуі мүмкін.
Сонымен қатар, биоинформатиктер геномды өңдеудің жаңа әдістерін, атап айтқанда CRISPR/Cas9 жүйесін (иммундық жүйеге негізделген технология) әзірлеуде маңызды рөл атқарды. ). Осы ақуыздардың құрылымын және олардың эволюциялық дамуын биоинформатикалық талдаудың арқасында бұл жүйенің дәлдігі мен тиімділігі соңғы жылдары айтарлықтай өсті, бұл көптеген организмдердің (соның ішінде адамның) геномдарын мақсатты түрде редакциялауға мүмкіндік берді.
SkillFactory онлайн курстарын өту арқылы сіз нөлден бастап сұранысқа ие мамандықты ала аласыз немесе дағдылар мен жалақы бойынша Level Up аласыз:
Қосымша курстар
Ақпарат көзі: www.habr.com
