Дадзеныя ўнутры нас: Чым займаюцца біяінфарматыкі?

Дадзеныя ўнутры нас: Чым займаюцца біяінфарматыкі?
Расказваем пра людзей будучыні, якія расшыфроўваюць арганічную біг-дату. За апошнія два дзесяцігоддзі колькасць біялагічных дадзеных, якія можна прааналізаваць, вырасла ў шмат разоў дзякуючы таму, што быў расшыфраваны геном чалавека. Да гэтага мы і ўявіць не маглі, што па інфармацыі, якая захоўваецца літаральна ў нас у крыві, можна будзе вызначыць наша паходжанне, праверыць, як арганізм будзе рэагаваць на пэўныя лекі, і нават змяніць сваю біялагічную спадчыннасць.

Гэтыя і іншыя артыкулы раней за ўсё выходзяць у блогу на нашым сайце. Прыемнага чытання.

Атрыбуты сярэднестатыстычнага біяінфарматыкі такія ж, як у праграміста – чырвоныя вочы, сутулая выправа і сляды ад кававых кубкаў на працоўным стале. Аднак за гэтым сталом ідзе праца не над абстрактнымі алгарытмамі і камандамі, а над кодам самой прыроды, які можа шмат распавесці нам пра нас і свет вакол.

Эксперты ў гэтай галіне маюць справу з вялікімі аб'ёмамі дадзеных (напрыклад, вынікі секвенирования геному аднаго чалавека займаюць каля 100 гігабайт). Таму апрацоўка такога масіва інфармацыі патрабуе падыходаў і прыладаў Data Science. Лагічна, што паспяховы біяінфарматык павінен разбірацца не толькі ў біялогіі і хіміі, але і ў метадах аналізу дадзеных, статыстыцы і матэматыцы - гэта робіць яго прафесію дастаткова рэдкай і запатрабаванай. Такія спецыялісты асабліва патрэбны ў галінах інавацыйнай медыцыны і распрацоўцы лекаў. Тэхналагічны гіганты накшталт IBM і Intel адкрываюць свае праграмы, прысвечаныя вывучэнню біяінфарматыкі.

Што трэба, каб стаць біяінфарматыкам?

  • Біялогія і хімія (універсітэцкі ўзровень);
  • Матстат, лінейная алгебра, тэорыя імавернасцей;
  • Мовы праграмавання (Python і R, часта таксама выкарыстоўваюць C++);
  • Для структурнай біяінфарматыкі: разуменне матэматычнага аналізу і тэорыі дыферэнцыяльных ураўненняў.

Увайсці ў галіну біяінфарматыкі можна як з біялагічнай базай, так і з веданнем праграмавання і матэматыкі. Для першых падыдзе праца з гатовымі біяінфарматычнымі праграмы, для другіх - больш алгарытмічны профіль спецыяльнасці.

Дадзеныя ўнутры нас: Чым займаюцца біяінфарматыкі?

Чым займаюцца біяінфарматыкі?

Сучасная біяінфарматыка дзеліцца на два асноўныя адгалінаванні - структурная біяінфарматыка і біяінфарматыка паслядоўнасцяў. У першым выпадку мы бачым чалавека, які сядзіць перад кампутарам і запускае праграмы, якія дапамагаюць вывучаць біялагічныя аб'екты (напрыклад, ДНК ці вавёркі) у 3D-візуалізацыях. Яны будуюць кампутарныя мадэлі, якія дазваляюць прадказаць, як малекула лекі будзе ўзаемадзейнічаць з бялком, як выглядае прасторавая структура бялку ў клетцы, якімі ўласцівасцямі малекулы тлумачацца яе ўзаемадзеянні з клеткавымі структурамі і т. д.

Метады структурнай біяінфарматыкі актыўна выкарыстоўваюцца як у акадэмічнай навуцы, так і ў індустрыі: складана ўявіць фармкампанію, якая абыходзіцца без такіх спецыялістаў. За апошнія гады кампутарныя метады дазволілі ў разы спрасціць працэс пошуку патэнцыйных лекаў, што зрабіла фармацэўтычную распрацоўку значна хутчэйшым і танным працэсам.

Дадзеныя ўнутры нас: Чым займаюцца біяінфарматыкі?
РНК-залежная РНК-полимераза SARS-CoV-2 (злева), а таксама яе сувязь з дуплекс РНК. Крыніца.

Што такое геном?

Геном гэта ўся інфармацыя аб будынку спадчыннасці арганізма. Практычна ва ўсіх жывых істот носьбітам геному з'яўляецца ДНК, але ёсць арганізмы, якія перадаюць сваю спадчынную інфармацыю ў выглядзе РНК. Геном перадаецца ад бацькоў да дзяцей, і падчас гэтага працэсу перадачы могуць узнікаць памылкі - мутацыі.

Дадзеныя ўнутры нас: Чым займаюцца біяінфарматыкі?
Узаемадзеянне лекі ремдесивира з РНК-залежнай РНК-полімеразай віруса SARS-CoV-2. Крыніца.

Біяінфарматыкі паслядоўнасцяў працуе з больш высокім узроўнем арганізацыі жывой матэрыі - пачынаючы з асобных нуклеатыдаў, ДНК і генаў, і заканчваючы цэлымі геному і іх параўнаннямі адзін з адным.

Уявіце сабе чалавека, які бачыць перад сабой набор літар алфавіту (але не простага, а генетычнага ці амінакіслотнага) і шукае ў іх заканамернасці, тлумачачы і пацвярджаючы іх статыстычна, з выкарыстаннем камп'ютарных метадаў. Біяінфарматыкі паслядоўнасцяў тлумачыць, з якой мутацыяй звязана тое ці іншае захворванне або чаму ў крыві пацыента назапашваюцца шкоднасныя рэчывы. Апроч медыцынскіх дадзеных, біяінфарматыкі паслядоўнасцяў вывучаюць заканамернасці распаўсюджвання арганізмаў па зямлі, папуляцыйныя адрозненні паміж групамі жывёл, ролі і функцыі пэўных генаў. Дзякуючы гэтай навуцы можна правяраць эфектыўнасць лекаў і вывучаць біялагічныя механізмы, якія тлумачаць іх дзеянне.

Напрыклад, дзякуючы биоинформатическому аналізу былі знойдзены і апісаны мутацыі, якія прыводзяць да развіцця муковісцідоза - манагеннага захворвання, выкліканага паломкай гена аднаго з хлоркавых каналаў. А яшчэ зараз мы значна лепш ведаем, хто даводзіцца бліжэйшым біялагічным сваяком чалавеку і як нашы продкі рассяляліся па планеце. Больш за тое, кожны чалавек, прачытаўшы свой геном, можа даведацца, адкуль паходзіць яго род і да якой этнічнай групы ён належыць. Мноства замежных (23andmeMyHeritage) і расійскіх (GenotekАтлант) сэрвісаў дазваляюць атрымаць гэтую паслугу за параўнальна невялікі кошт (каля 20 тыс. рублёў).

Дадзеныя ўнутры нас: Чым займаюцца біяінфарматыкі?
Вынікі аналізу ДНК-тэсту на паходжанне і папуляцыйную прыналежнасць ад кампаніі MyHeritage.

Дадзеныя ўнутры нас: Чым займаюцца біяінфарматыкі?
Вынікі аналізу ДНК-тэста на папуляцыйную прыналежнасць ад кампаніі 23andMe.

Як чытаюць геном?

Сёння секвеніраванне геному - руцінная працэдура, якая абыйдзецца любому жадаючаму прыкладна ў 150 тыс. рублёў (у тым ліку, у Расіі). Каб прачытаць свой геном, дастаткова проста здаць у спецыяльнай лабараторыі кроў з вены: праз два тыдні вы атрымаеце гатовы вынік з дэталёвым апісаннем вашых генетычных асаблівасцяў. Апроч свайго геному можна прааналізаваць генома мікрабіёты кішачніка: вы даведаецеся асаблівасці бактэрый, якія насяляюць вашу стрававальную сістэму, а таксама атрымаеце кансультацыю ад прафесійнага дыетолага.

Геном можна прачытаць рознымі метадамі, адным з асноўных зараз з'яўляецца так званае "секвеніраванне новага пакалення". Для правядзення гэтай працэдуры неабходна спачатку атрымаць біялагічныя ўзоры. У кожнай клетцы арганізма геном аднолькавы, таму часцей за ўсё для чытання геному бяруць кроў (гэта прасцей за ўсё). Пасля гэтага клеткі руйнуюць і адлучаюць ДНК ад усяго астатняга. Затым, атрыманую ДНК дробняць на мноства маленькіх кавалачкаў і "прышываюць" да кожнага з іх спецыяльныя адаптары - штучна сінтэзаваныя вядомыя паслядоўнасці нуклеатыдаў. Потым ланцужкі ДНК падзяляюць, і однонитевые ланцужкі з дапамогай адаптараў далучаюць да спецыяльнай плашчак, на якой праводзіцца секвеніраванне. У ходзе секвеніравання да паслядоўнасці ДНК далучаюцца камплементарныя флуарэсцэнтна пазначаныя нуклеатыдаў. Кожны пазначаны нуклеатыд пры далучэнні выпускае пучок святла вызначанай даўжыні хвалі, што фіксуецца на кампутары. Так кампутар прачытвае кароткія паслядоўнасці зыходнай ДНК, якія потым з дапамогай спецыяльных алгарытмаў збіраюцца ў зыходны геном.

Дадзеныя ўнутры нас: Чым займаюцца біяінфарматыкі?
Прыклад даных, з якімі працуюць біяінфарматыкі паслядоўнасцей: выраўноўванне амінакіслотных паслядоўнасцей.

Дзе працуюць і колькі атрымліваюць біяінфарматыкі?

Шлях біяінфарматыкі традыцыйна дзеліцца на дзве асноўныя вобласці - індустрыя і навука. Кар'ера вучонага-біяінфарматыка звычайна пачынаецца з аспіранцкай пасады ў адным з буйных інстытутаў. Першапачаткова біяінфарматыкі атрымліваюць базавую стаўку, якая залежыць ад іх інстытута, колькасці грантаў, у якіх яны бяруць удзел, а таксама іх колькасці афіляцый - месцаў, у якіх яны афіцыйна працаўладкаваны. З часам колькасць грантаў і афіляцый расце, і недзе праз пару гадоў працы ў акадэмічным асяроддзі біяінфарматык без праблем атрымлівае сярэдні заробак (70-80 тыс. рублёў), аднак шмат залежыць ад стараннасці і працавітасці. Найбольш вопытныя біяінфарматыкі ў канчатковым выніку заводзяць уласныя лабараторыі ў сферах сваёй спецыялізацыі.

Дадзеныя ўнутры нас: Чым займаюцца біяінфарматыкі?

Дзе вучацца на біяінфарматыкі?

  • МДУ - факультэт біяінжынерыі і біяінфарматыкі
  • ВШЭ - Аналіз дадзеных у біялогіі і медыцыне (магістарская праграма)
  • МФТІ - кафедра біяінфарматыкі
  • Інстытут біяінфарматыкі (НКА)

У адрозненне ад акадэміі, у індустрыі ніхто не будзе марнаваць свой час на навучанне супрацоўніка неабходным навыкам, таму і патрапіць туды звычайна складаней. Кар'ерны шлях біяінфарматыкі ў індустрыі вельмі вар'іруецца ў залежнасці ад яго спецыялізацыі і месцы працы. У сярэднім, заработная плата ў гэтай галіне вагаецца ад 70 тыс. да 150 тыс. рублёў, у залежнасці ад досведу і спецыялізацыі. 

Вядомыя біяінфарматыкі

Гісторыю біяінфарматыкі варта весці ад Фрэдэрыка Сэнгера, англійскага вучонага, які атрымаў у 1980 годзе Нобелеўскую прэмію па хіміі за адкрыццё спосабу прачытання паслядоўнасці ДНК. З таго часу, з кожным годам метады чытання паслядоўнасцяў удасканальваюцца, аднак метад «секвеніравання па Сэнгеру» паслужыў асновай для ўсіх далейшых даследаванняў у гэтай галіне.

Дадзеныя ўнутры нас: Чым займаюцца біяінфарматыкі?

Дарэчы, многія праграмы, створаныя менавіта расійскімі навукоўцамі, сёння шырока выкарыстоўваюцца ва ўсім свеце - напрыклад, геномны зборшчык. SPAdes, - St. Petersburg genome assembler, створаны ў Санкт-Пецярбургскім інстытуце, дапамагае навукоўцам з усяго свету збіраць кароткія паслядоўнасці ДНК у вялікія паслядоўнасці, каб аднавіць зыходныя генома арганізмаў.

Адкрыцці і дасягненні біяінфарматыкі

У наш час біяінфарматыкі здзяйсняюць мноства карысных адкрыццяў. Немагчыма было б уявіць распрацоўку лекаў ад каранавіруса без расшыфроўкі яго геному і складанага біяінфарматычнага аналізу працэсаў, якія адбываюцца ў ходзе захворвання. Міжнародная група навукоўцаў з дапамогай метадаў параўнальнай геномікі і машыннага навучання змагла зразумець, што агульнага ў каранавірусы з іншымі патагенамі.

Аказалася, што адна з такіх асаблівасцяў - адбывалае падчас эвалюцыі ўзмацненне сігналаў ядзернай лакалізацыі (NLS) патагенных вірусаў. Гэта даследаванне можа дапамагчы ў вывучэнні штамаў вірусаў, якія могуць быць патэнцыйна небяспечнымі для чалавека ў будучыні, і, магчыма, пачаць прэвентыўную распрацоўку лекавых прэпаратаў. 

Акрамя гэтага, біяінфарматыкі адыгралі ключавую ролю ў распрацоўцы новых метадаў рэдагавання геному, у прыватнасці, CRISPR/Cas9 сістэмы (тэхналогія, якая базуецца на імуннай сістэме). бактэрый). Дзякуючы биоинформатическому аналізу структуры дадзеных бялкоў і іх эвалюцыйнага развіцця, дакладнасць і эфектыўнасць гэтай сістэмы за апошнія гады вырасла ў разы, што дазволіла мэтанакіравана рэдагаваць генома многіх арганізмаў (у тым ліку чалавека).

Дадзеныя ўнутры нас: Чым займаюцца біяінфарматыкі?
Атрымаць запатрабаваную прафесію з нуля або Level Up па навыках і зарплаце, можна, прайшоўшы анлайн-курсы SkillFactory:

Яшчэ курсы

Крыніца: habr.com

Дадаць каментар