Les dades dins nostre: què fan els bioinformàtics?

Les dades dins nostre: què fan els bioinformàtics?
Estem parlant de gent del futur que desxifra la gran cita orgànica. Durant les últimes dues dècades, la quantitat de dades biològiques que es poden analitzar ha augmentat moltes vegades a causa de la seqüenciació del genoma humà. Abans d'això, ni tan sols podríem imaginar que utilitzant la informació emmagatzemada literalment a la nostra sang, seria possible determinar el nostre origen, comprovar com reaccionarà el cos davant determinades drogues i fins i tot canviar la nostra herència biològica.

Aquest i altres articles apareixen primer a bloc al nostre lloc web. Gaudeix de la lectura.

Els atributs del bioinformàtic mitjà són els mateixos que els d'un programador: ulls vermells, postura encorbada i marques de les tasses de cafè a l'escriptori. Tanmateix, en aquesta taula el treball no és sobre algorismes i ordres abstractes, sinó sobre el propi codi de la naturalesa, que ens pot dir molt sobre nosaltres i el món que ens envolta.

Els especialistes en aquest camp tracten grans quantitats de dades (per exemple, els resultats de la seqüenciació del genoma d'una persona ocupen uns 100 gigabytes). Per tant, el processament d'aquest conjunt d'informació requereix enfocaments i eines de Data Science. És lògic que un bioinformàtic reeixit no només entengui la biologia i la química, sinó també els mètodes d'anàlisi de dades, les estadístiques i les matemàtiques; això fa que la seva professió sigui força rara i demanada. Aquests especialistes són especialment necessaris en les àrees de la medicina innovadora i el desenvolupament de fàrmacs. Gegants tecnològics com IBM i Intel obrir els seus programes, dedicada a l'estudi de la bioinformàtica.

Què es necessita per convertir-se en bioinformàtic?

  • Biologia i Química (nivell universitari);
  • Matstat, àlgebra lineal, teoria de la probabilitat;
  • Llenguatges de programació (Python i R, sovint també utilitzant C++);
  • Per a la bioinformàtica estructural: entendre l'anàlisi matemàtica i la teoria d'equacions diferencials.

Podeu entrar al camp de la bioinformàtica tant amb una formació biològica com amb coneixements de programació i matemàtiques. Pels primers, treballar amb programes bioinformàtics ja fets és adequat, per al segon, un perfil més algorítmic de l'especialitat.

Les dades dins nostre: què fan els bioinformàtics?

Què fan els bioinformàtics?

La bioinformàtica moderna es divideix en dues branques principals: la bioinformàtica estructural i la bioinformàtica de seqüències. En el primer cas, veiem una persona asseguda davant d'un ordinador i executant programes que ajuden a estudiar objectes biològics (per exemple, ADN o proteïnes) en visualitzacions 3D. Construeixen models informàtics que permeten predir com interactuarà una molècula de fàrmac amb una proteïna, com és l'estructura espacial d'una proteïna en una cèl·lula, quines propietats de la molècula expliquen les seves interaccions amb les estructures cel·lulars, etc.

Els mètodes de bioinformàtica estructural s'utilitzen activament tant a la ciència acadèmica com a la indústria: és difícil imaginar una empresa farmacèutica que pugui prescindir d'aquests especialistes. En els últims anys, els mètodes informàtics han simplificat molt el procés de cerca de possibles fàrmacs, fent que el desenvolupament farmacèutic sigui un procés molt més ràpid i econòmic.

Les dades dins nostre: què fan els bioinformàtics?
ARN polimerasa depenent de l'ARN SARS-CoV-2 (esquerra), així com la seva associació amb el dúplex d'ARN. Font.

Què és un genoma?

El genoma és tota la informació sobre l'estructura de l'herència d'un organisme. En gairebé tots els éssers vius, el portador del genoma és l'ADN, però hi ha organismes que transmeten la seva informació hereditària en forma d'ARN. El genoma es transmet de pares a fills i durant aquest procés de transmissió es poden produir errors anomenats mutacions.

Les dades dins nostre: què fan els bioinformàtics?
Interacció del fàrmac remdesivir amb l'ARN polimerasa dependent de l'ARN del virus SARS-CoV-2. Font.

La bioinformàtica de seqüències s'ocupa d'un nivell més alt d'organització de la matèria viva: des de nucleòtids individuals, ADN i gens, fins a genomes sencers i les seves comparacions entre si.

Imagineu una persona que veu davant seu un conjunt de lletres de l'alfabet (però no una simple, sinó una genètica o d'aminoàcids) i hi cerca patrons, explicant-los i confirmant-los estadísticament, mitjançant mètodes informàtics. La bioinformàtica de seqüències explica quina mutació està associada a una malaltia en particular o per què s'acumulen substàncies nocives a la sang d'un pacient. A més de les dades mèdiques, els bioinformàtics de seqüències estudien els patrons de distribució dels organismes a la terra, les diferències poblacionals entre grups d'animals i els rols i funcions de gens específics. Gràcies a aquesta ciència, és possible provar l'eficàcia dels fàrmacs i estudiar els mecanismes biològics que expliquen la seva acció.

Per exemple, gràcies a l'anàlisi bioinformàtica, es van trobar i descriure mutacions que van conduir al desenvolupament de la fibrosi quística, una malaltia monogènica causada per una ruptura del gen d'un dels canals de clorur. I ara sabem molt millor qui és el parent biològic més proper de l'home i com es van establir els nostres avantpassats al voltant del planeta. A més, cada persona, llegint el seu genoma, pot esbrinar d'on prové la seva família i a quina ètnia pertany. Molts estrangers (23andmeMyHeritage) i rus (GenotekAtles) els serveis us permeten obtenir aquest servei per un preu relativament baix (uns 20 mil rubles).

Les dades dins nostre: què fan els bioinformàtics?
Resultats de l'anàlisi d'ADN per a l'origen i l'afiliació a la població de MyHeritage.

Les dades dins nostre: què fan els bioinformàtics?
Resultats d'una prova de població d'ADN de 23andMe.

Com es llegeix el genoma?

Avui dia, la seqüenciació del genoma és un procediment rutinari que costarà a qualsevol persona aproximadament 150 mil rubles (inclòs a Rússia). Per llegir el teu genoma, només has de donar sang d'una vena en un laboratori especial: en dues setmanes rebràs un resultat final amb una descripció detallada de les teves característiques genètiques. A més del teu genoma, pots analitzar els genomes de la teva microbiota intestinal: coneixeràs les característiques dels bacteris que habiten el teu sistema digestiu, i també rebràs l'assessorament d'un nutricionista professional.

El genoma es pot llegir mitjançant diferents mètodes, un dels principals ara és l'anomenat “seqüenciació de pròxima generació”. Per dur a terme aquest procediment, primer s'han d'obtenir mostres biològiques. Cada cèl·lula del cos té el mateix genoma, de manera que la majoria de vegades es pren sang per llegir el genoma (això és el més fàcil). Aleshores, les cèl·lules es descomponen i separen l'ADN de tota la resta. Aleshores, l'ADN resultant es divideix en molts trossos petits i es "coseixen" adaptadors especials a cadascun d'ells: seqüències de nucleòtids conegudes sintetitzades artificialment. A continuació, se separen les cadenes d'ADN i s'uneixen les cadenes monocatenàries mitjançant adaptadors a una placa especial sobre la qual es realitza la seqüenciació. Durant la seqüenciació, s'afegeixen nucleòtids complementaris marcats fluorescentment a la seqüència d'ADN. Cada nucleòtid marcat, quan s'uneix, emet un feix de llum d'una determinada longitud d'ona, que es registra a l'ordinador. Així és com l'ordinador llegeix seqüències curtes de l'ADN original, que després s'assemblen al genoma original mitjançant algorismes especials.

Les dades dins nostre: què fan els bioinformàtics?
Un exemple de dades amb què treballen els bioinformàtics de seqüències: alineació de seqüències d'aminoàcids.

On treballen els bioinformàtics i quant guanyen?

El camí de la bioinformàtica es divideix tradicionalment en dues àrees principals: la indústria i la ciència. Una carrera com a científic bioinformàtic normalment comença amb una posició de postgrau en un institut important. Inicialment, els bioinformàtics reben un sou base en funció del seu institut, el nombre de beques en què participen i el nombre d'afiliacions, llocs on treballen formalment. Amb el temps, el nombre de subvencions i afiliacions creix, i després d'uns dos anys de treball en un entorn acadèmic, un bioinformàtic rep fàcilment un sou mitjà (70-80 mil rubles), però depèn molt de la diligència i el treball dur. Els bioinformàtics més experimentats acaben dirigint els seus propis laboratoris en les seves àrees d'especialització.

Les dades dins nostre: què fan els bioinformàtics?

On estudies bioinformàtica?

  • Universitat Estatal de Moscou - Facultat de Bioenginyeria i Bioinformàtica
  • HSE - Anàlisi de dades en biologia i medicina (programa de màster)
  • MIPT - Departament de Bioinformàtica
  • Institut de Bioinformàtica (NPO)

A diferència d'una acadèmia, ningú de la indústria passarà el seu temps ensenyant a un empleat les habilitats necessàries, de manera que arribar-hi sol ser més difícil. La trajectòria professional d'un bioinformàtic a la indústria varia molt en funció de la seva especialització i ubicació. De mitjana, els sous en aquest camp fluctuen de 70 mil a 150 mil rubles, depenent de l'experiència i l'especialització. 

Bioinformàtics famosos

La història de la bioinformàtica es remunta a Frederick Sanger, un científic anglès que va rebre el Premi Nobel de Química l'any 1980 pel seu descobriment d'una manera de llegir seqüències d'ADN. Des de llavors, els mètodes de lectura de seqüències han millorat cada any, però el mètode de "seqüenciació Sanger" va servir de base per a totes les investigacions posteriors en aquesta àrea.

Les dades dins nostre: què fan els bioinformàtics?

Per cert, molts programes creats per científics russos s'utilitzen àmpliament a tot el món, per exemple, l'assemblador del genoma. SPAdes, - St. L'assemblador del genoma de Petersburg, creat a l'Institut de Sant Petersburg, ajuda els científics de tot el món a reunir seqüències d'ADN curtes en seqüències més grans per reconstruir els genomes originals dels organismes.

Descobriments i assoliments de la bioinformàtica

Avui en dia, els bioinformàtics fan molts descobriments útils. Seria impossible imaginar el desenvolupament de fàrmacs per al coronavirus sense desxifrar el seu genoma i una complexa anàlisi bioinformàtica dels processos que es produeixen durant la malaltia. Internacional группа Els científics que van utilitzar mètodes de genòmica comparada i d'aprenentatge automàtic van ser capaços d'entendre què tenen en comú els coronavirus amb altres patògens.

Va resultar que una d'aquestes característiques és l'enfortiment dels senyals de localització nuclear (NLS) de virus patògens que es produeix durant l'evolució. Aquesta investigació podria ajudar a estudiar soques de virus que podrien ser potencialment perilloses per als humans en el futur i potser conduir al desenvolupament preventiu de fàrmacs. 

A més, els bioinformàtics han tingut un paper clau en el desenvolupament de nous mètodes d'edició del genoma, en particular el sistema CRISPR/Cas9 (una tecnologia basada en el sistema immunitari). bacteris). Gràcies a l'anàlisi bioinformàtica de l'estructura d'aquestes proteïnes i el seu desenvolupament evolutiu, la precisió i l'eficiència d'aquest sistema ha augmentat significativament en els darrers anys, fet que ha permès editar intencionadament els genomes de molts organismes (inclosos els humans).

Les dades dins nostre: què fan els bioinformàtics?
Podeu obtenir una professió sol·licitada des de zero o pujar de nivell en termes d'habilitats i salari fent els cursos en línia de SkillFactory:

Més cursos

Font: www.habr.com

Afegeix comentari