Data in ons: wat doen bio-informatici?

Data in ons: wat doen bio-informatici?
We hebben het over mensen van de toekomst die de organische big date ontcijferen. De afgelopen twintig jaar is de hoeveelheid biologische gegevens die kan worden geanalyseerd veelvoudig toegenomen als gevolg van de sequencing van het menselijk genoom. Voordien konden we ons niet eens voorstellen dat het met behulp van de informatie die letterlijk in ons bloed was opgeslagen, mogelijk zou zijn om onze oorsprong te bepalen, na te gaan hoe het lichaam op bepaalde medicijnen zal reageren en zelfs onze biologische erfelijkheid te veranderen.

Dit en andere artikelen verschijnen als eerste in blog op onze website. Veel plezier met lezen.

De eigenschappen van de gemiddelde bio-informaticus zijn dezelfde als die van een programmeur: rode ogen, gebogen houding en vlekken van koffiekopjes op het bureaublad. Aan deze tafel wordt echter niet gewerkt aan abstracte algoritmen en commando's, maar aan de code van de natuur zelf, die ons veel over ons en de wereld om ons heen kan vertellen.

Specialisten op dit gebied hebben te maken met enorme hoeveelheden gegevens (de resultaten van het sequencen van het genoom van één persoon nemen bijvoorbeeld ongeveer 100 gigabyte in beslag). Daarom vereist het verwerken van een dergelijke reeks informatie Data Science-benaderingen en -hulpmiddelen. Het is logisch dat een succesvolle bio-informaticus niet alleen biologie en scheikunde begrijpt, maar ook data-analysemethoden, statistiek en wiskunde - dit maakt zijn beroep vrij zeldzaam en veelgevraagd. Dergelijke specialisten zijn vooral nodig op het gebied van innovatieve geneeskunde en geneesmiddelenontwikkeling. Techgiganten als IBM en Intel hun programma's openen, gewijd aan de studie van bio-informatica.

Wat is er nodig om bio-informaticus te worden?

  • Biologie en scheikunde (universitair niveau);
  • Matstat, lineaire algebra, waarschijnlijkheidstheorie;
  • Programmeertalen (Python en R, vaak ook met C++);
  • Voor structurele bio-informatica: inzicht in wiskundige analyse en de theorie van differentiaalvergelijkingen.

Je kunt het vakgebied bio-informatica betreden met zowel een biologische achtergrond als kennis van programmeren en wiskunde. Voor het eerste is het werken met kant-en-klare bio-informaticaprogramma's geschikt, voor het tweede een meer algoritmisch profiel van het specialisme.

Data in ons: wat doen bio-informatici?

Wat doen bio-informatici?

De moderne bio-informatica is verdeeld in twee hoofdtakken: structurele bio-informatica en sequentiebio-informatica. In het eerste geval zien we een persoon achter een computer zitten en programma's draaien die helpen bij het bestuderen van biologische objecten (bijvoorbeeld DNA of eiwitten) in 3D-visualisaties. Ze bouwen computermodellen die het mogelijk maken om te voorspellen hoe een medicijnmolecuul zal interageren met een eiwit, hoe de ruimtelijke structuur van een eiwit er in een cel uitziet, welke eigenschappen van het molecuul de interacties met cellulaire structuren verklaren, enz.

Structurele bio-informaticamethoden worden zowel in de academische wetenschap als in de industrie actief gebruikt: het is moeilijk een farmaceutisch bedrijf voor te stellen dat zonder dergelijke specialisten kan. De afgelopen jaren hebben computermethoden het proces van het zoeken naar potentiële medicijnen aanzienlijk vereenvoudigd, waardoor de farmaceutische ontwikkeling een veel sneller en goedkoper proces is geworden.

Data in ons: wat doen bio-informatici?
SARS-CoV-2 RNA-afhankelijk RNA-polymerase (links), evenals de associatie ervan met de RNA-duplex. Bron.

Wat is een genoom?

Het genoom is alle informatie over de structuur van de erfelijkheid van een organisme. Bij vrijwel alle levende wezens is DNA de drager van het genoom, maar er zijn organismen die hun erfelijke informatie doorgeven in de vorm van RNA. Het genoom wordt doorgegeven van ouders op kinderen, en tijdens dit overdrachtsproces kunnen fouten optreden die mutaties worden genoemd.

Data in ons: wat doen bio-informatici?
Interactie van het medicijn remdesivir met het RNA-afhankelijke RNA-polymerase van het SARS-CoV-2-virus. Bron.

Sequentiebio-informatica houdt zich bezig met een hoger niveau van organisatie van levende materie - van individuele nucleotiden, DNA en genen tot volledige genomen en hun vergelijkingen met elkaar.

Stel je een persoon voor die een reeks letters van het alfabet voor zich ziet (maar niet een eenvoudige, maar een genetische of aminozuurletter) en daarin naar patronen zoekt, deze statistisch uitlegt en bevestigt met behulp van computermethoden. Sequentiebio-informatica legt uit welke mutatie geassocieerd is met een bepaalde ziekte of waarom schadelijke stoffen zich ophopen in het bloed van een patiënt. Naast medische gegevens bestuderen sequentiebio-informatici de verspreidingspatronen van organismen over de hele aarde, populatieverschillen tussen groepen dieren en de rollen en functies van specifieke genen. Dankzij deze wetenschap is het mogelijk om de effectiviteit van medicijnen te testen en de biologische mechanismen te bestuderen die hun werking verklaren.

Dankzij bio-informatica-analyse werden bijvoorbeeld mutaties gevonden en beschreven die leidden tot de ontwikkeling van cystische fibrose, een monogene ziekte veroorzaakt door een afbraak van het gen van een van de chloridekanalen. En nu weten we veel beter wie de meest nabije biologische verwant van de mens is en hoe onze voorouders zich op de planeet vestigden. Bovendien kan ieder mens door het lezen van zijn genoom achterhalen waar zijn familie vandaan komt en tot welke etnische groep hij behoort. Veel buitenlandse (23andmeMyHeritage) en Russisch (GenotekAtlasMet ) services kunt u deze service krijgen voor een relatief lage prijs (ongeveer 20 duizend roebel).

Data in ons: wat doen bio-informatici?
Resultaten van DNA-testanalyse voor herkomst en populatieverwantschap van MyHeritage.

Data in ons: wat doen bio-informatici?
Resultaten van een DNA-populatietest van 23andMe.

Hoe wordt het genoom gelezen?

Tegenwoordig is genoomsequencing een routineprocedure die iedereen ongeveer zal kosten 150 duizend roebel (ook in Rusland). Om uw genoom uit te lezen, hoeft u alleen maar bloed te doneren uit een ader in een speciaal laboratorium: binnen twee weken ontvangt u een eindresultaat met een gedetailleerde beschrijving van uw genetische kenmerken. Naast uw genoom kunt u de genomen van uw darmmicrobiota analyseren: u leert de kenmerken van de bacteriën die in uw spijsverteringsstelsel leven, en krijgt ook advies van een professionele voedingsdeskundige.

Het genoom kan op verschillende manieren worden uitgelezen. Een van de belangrijkste is nu de zogenaamde ‘next-generation sequencing’. Om deze procedure uit te voeren, moeten eerst biologische monsters worden verkregen. Elke cel van het lichaam heeft hetzelfde genoom, dus meestal wordt bloed afgenomen om het genoom te lezen (dit is het gemakkelijkst). De cellen breken het DNA vervolgens af en scheiden het van al het andere. Vervolgens wordt het resulterende DNA in vele kleine stukjes gesplitst en aan elk ervan worden speciale adapters "genaaid" - kunstmatig gesynthetiseerde bekende nucleotidesequenties. Vervolgens worden de DNA-strengen gescheiden en worden enkelstrengige strengen met behulp van adapters aan een speciale plaat bevestigd waarop sequencing wordt uitgevoerd. Tijdens het sequencen worden complementaire fluorescent gelabelde nucleotiden aan de DNA-sequentie toegevoegd. Elke gelabelde nucleotide zendt, wanneer hij is bevestigd, een lichtstraal van een bepaalde golflengte uit, die op de computer wordt vastgelegd. Zo leest de computer korte sequenties van het originele DNA, die vervolgens met behulp van speciale algoritmen tot het originele genoom worden samengevoegd.

Data in ons: wat doen bio-informatici?
Een voorbeeld van gegevens waar bio-informatici mee werken: aminozuursequentie-uitlijning.

Waar werken bio-informatici en hoeveel verdienen ze?

Het bio-informaticapad is traditioneel verdeeld in twee hoofdgebieden: industrie en wetenschap. Een carrière als bio-informatica-wetenschapper begint doorgaans met een afstudeeropdracht bij een groot instituut. In eerste instantie ontvangen bio-informatici een basissalaris op basis van hun instituut, het aantal beurzen waaraan zij deelnemen en het aantal aangesloten organisaties – plaatsen waar zij formeel werkzaam zijn. In de loop van de tijd groeit het aantal beurzen en lidmaatschappen, en na ongeveer een paar jaar werken in een academische omgeving ontvangt een bio-informaticus gemakkelijk een gemiddeld salaris (70-80 duizend roebel), maar veel hangt af van toewijding en hard werken. De meest ervaren bio-informatici runnen uiteindelijk hun eigen laboratoria in hun specialisatiegebied.

Data in ons: wat doen bio-informatici?

Waar studeer je voor bio-informatica?

  • Staatsuniversiteit van Moskou - Faculteit Bio-ingenieur en Bio-informatica
  • HSE - Data-analyse in biologie en geneeskunde (masterprogramma)
  • MIPT - Afdeling Bio-informatica
  • Instituut voor Bio-informatica (NPO)

In tegenstelling tot een academie zal niemand in de branche zijn tijd besteden aan het aanleren van de noodzakelijke vaardigheden aan een werknemer, dus het is meestal moeilijker om daar te komen. Het carrièrepad van een bio-informaticus in de industrie varieert sterk, afhankelijk van hun specialisatie en locatie. Gemiddeld fluctueren de salarissen in dit vakgebied van 70 duizend naar 150 duizend roebel, afhankelijk van ervaring en specialisatie. 

Beroemde bio-informatici

De geschiedenis van de bio-informatica gaat terug tot Frederick Sanger, een Engelse wetenschapper die in 1980 de Nobelprijs voor de Scheikunde ontving voor zijn ontdekking van een manier om DNA-sequenties te lezen. Sindsdien zijn de methoden voor het lezen van sequenties elk jaar verbeterd, maar de ‘Sanger sequencing’-methode diende als basis voor al het verdere onderzoek op dit gebied.

Data in ons: wat doen bio-informatici?

Trouwens, veel programma's die door Russische wetenschappers zijn gemaakt, worden nu over de hele wereld op grote schaal gebruikt, bijvoorbeeld de genoomassembler SPAden, -St. Petersburg genome assembler, gemaakt door het St. Petersburg Instituut, helpt wetenschappers van over de hele wereld korte DNA-sequenties samen te stellen tot grotere sequenties om de oorspronkelijke genomen van organismen te reconstrueren.

Ontdekkingen en prestaties van de bio-informatica

Tegenwoordig doen bio-informatici veel nuttige ontdekkingen. Het zou onmogelijk zijn om de ontwikkeling van medicijnen voor het coronavirus voor te stellen zonder het genoom ervan te ontcijferen en de complexe bio-informatica-analyse van de processen die plaatsvinden tijdens de ziekte. Internationale группа Wetenschappers die vergelijkende genomica en machine learning-methoden gebruikten, konden begrijpen wat coronavirussen gemeen hebben met andere pathogenen.

Het bleek dat een van deze kenmerken de versterking is van nucleaire lokalisatiesignalen (NLS) van pathogene virussen die optreden tijdens de evolutie. Dit onderzoek zou kunnen helpen bij het bestuderen van virusstammen die in de toekomst potentieel gevaarlijk kunnen zijn voor mensen, en misschien kunnen leiden tot de ontwikkeling van preventieve geneesmiddelen. 

Daarnaast hebben bio-informatici een sleutelrol gespeeld bij de ontwikkeling van nieuwe genoombewerkingsmethoden, in het bijzonder het CRISPR/Cas9-systeem (een technologie gebaseerd op het immuunsysteem bacteriën). Dankzij bio-informatica-analyse van de structuur van deze eiwitten en hun evolutionaire ontwikkeling is de nauwkeurigheid en efficiëntie van dit systeem de afgelopen jaren aanzienlijk toegenomen, wat het mogelijk heeft gemaakt om doelbewust de genomen van veel organismen (inclusief mensen) te bewerken.

Data in ons: wat doen bio-informatici?
U kunt een gewild beroep helemaal opnieuw opbouwen of een hoger niveau bereiken in termen van vaardigheden en salaris door de online cursussen van SkillFactory te volgen:

Meer cursussen

Bron: www.habr.com

Voeg een reactie