我們體內的數據:生物信息學家做什麼?

我們體內的數據:生物信息學家做什麼?
我們談論的是未來的人們,他們破解了有機大日期。 在過去的二十年中,由於人類基因組定序,可分析的生物數據量增加了許多倍。 在此之前,我們甚至無法想像,利用儲存在我們血液中的信息,可以確定我們的起源,檢查身體對某些藥物的反應,甚至改變我們的生物遺傳。

這篇文章和其他文章首先出現在 блоге 在我們的網站上。 享受閱讀。

一般生物資訊學家的特徵與程式設計師相同——紅眼睛、彎腰駝背、桌面上咖啡杯留下的痕跡。 然而,這張桌子上的工作不是抽象的演算法和命令,而是自然的程式碼本身,它可以告訴我們很多關於我們自己和周圍世界的資訊。

該領域的專家處理大量數據(例如,一個人的基因組定序結果約佔 100 GB)。 因此,處理如此大量的資訊需要數據科學方法和工具。 順理成章的是,一個成功的生物資訊學家不僅應該了解生物學和化學,還應該了解資料分析方法、統計學和數學——這使得他的職業相當稀有且需求旺盛。 創新醫學和藥物開發領域尤其需要此類專家。 IBM、英特爾等科技巨頭 打開他們的程式,致力於生物資訊學的研究。

成為生物資訊學家需要什麼?

  • 生物和化學(大學水平);
  • Matstat、線性代數、機率論;
  • 程式語言(Python和R,通常也使用C++);
  • 對於結構生物資訊:理解數學分析和微分方程理論。

您可以憑藉生物學背景以及程式設計和數學知識進入生物資訊學領域。 對於前者,使用現成的生物資訊學程式是合適的,而對於後者,則適合使用更演算法的專業概況。

我們體內的數據:生物信息學家做什麼?

生物資訊學家做什麼的?

現代生物資訊學分為兩個主要分支-結構生物資訊學和序列生物資訊學。 在第一種情況下,我們看到一個人坐在電腦前運行程序,幫助研究 3D 視覺化中的生物物件(例如 DNA 或蛋白質)。 他們建立了電腦模型,可以預測藥物分子如何與蛋白質相互作用、蛋白質在細胞中的空間結構是什麼樣子、分子的哪些特性解釋了其與細胞結構的相互作用等。

結構生物資訊學方法在學術科學和工業界都得到了積極的應用:很難想像一家製藥公司可以沒有這樣的專家。 近年來,電腦方法極大地簡化了尋找潛在藥物的過程,使藥物開發過程變得更快、更便宜。

我們體內的數據:生物信息學家做什麼?
SARS-CoV-2 RNA 依賴性 RNA 聚合酶(左)及其與 RNA 雙股體的關聯。 來源。

什麼是基因組?

基因組是有關生物體遺傳結構的所有資訊。 在幾乎所有生物中,基因組的載體都是DNA,但也有一些生物以RNA的形式傳遞遺傳訊息。 基因組從父母傳遞給孩子,在這個傳遞過程中,可能會發生稱為突變的錯誤。

我們體內的數據:生物信息學家做什麼?
藥物瑞德西韋與 SARS-CoV-2 病毒的 RNA 依賴性 RNA 聚合酶的相互作用。 來源。

序列生物資訊學涉及生命物質的更高層次的組織——從單一核苷酸、DNA 和基因,到整個基因組及其相互比較。

想像一個人在他面前看到一組字母(但不是簡單的字母,而是遺傳或氨基酸的字母),並尋找其中的模式,使用計算機方法從統計上解釋和確認它們。 序列生物資訊學解釋了哪種突變與特定疾病相關,或者為什麼有害物質會在患者的血液中積聚。 除了醫學數據之外,序列生物資訊學家還研究地球上生物體的分佈模式、動物群體之間的族群差異以及特定基因的作用和功能。 借助這門科學,我們可以測試藥物的有效性並研究解釋其作用的生物機制。

例如,透過生物資訊分析,發現並描述了導致囊性纖維化發展的突變,囊性纖維化是一種由氯通道基因故障引起的單基因疾病。 現在我們更清楚誰是人類最親近的生物學親戚,以及我們的祖先如何在地球上定居。 而且,每個人透過讀取他的基因組,都可以知道他的家庭來自哪裡,屬於哪個種族。 許多外國(23andmeMyHeritage)和俄語(基因泰克阿特拉斯)服務可以讓您以相對較低的價格(約20萬盧布)獲得這項服務。

我們體內的數據:生物信息學家做什麼?
來自 MyHeritage 的起源和人口歸屬的 DNA 測試分析結果。

我們體內的數據:生物信息學家做什麼?
23andMe 的 DNA 群體測試結果。

基因組是如何被讀取的?

如今,基因組定序已成為一項常規程序,任何人都將花費約 150 千盧布(包括俄羅斯)。 要讀取您的基因組,您只需在特殊實驗室中從靜脈中捐獻血液:兩週後您將收到完整的結果,其中詳細描述了您的遺傳特徵。 除了您的基因組之外,您還可以分析腸道微生物群的基因組:您將了解消化系統中細菌的特徵,並獲得專業營養師的建議。

可以使用不同的方法讀取基因組,目前主要的方法之一是所謂的「下一代定序」。 為了執行此過程,必須先獲得生物樣本。 身體的每個細胞都有相同的基因組,因此最常見的是抽取血液來讀取基因組(這是最簡單的)。 然後細胞分解並將 DNA 與其他物質分離。 然後,所得的 DNA 被分成許多小片段,並將特殊的接頭「縫合」到每個小片段上 - 人工合成的已知核苷酸序列。 然後分離 DNA 鏈,並使用接頭將單鏈連接到特殊的板上,並在該板上進行定序。 在定序過程中,互補的螢光標記核苷酸被添加到 DNA 序列中。 每個標記的核苷酸在附著時會發出特定波長的光束,該光束會記錄在電腦上。 這就是電腦讀取原始 DNA 短序列的方式,然後使用特殊演算法將其組裝成原始基因組。

我們體內的數據:生物信息學家做什麼?
生物資訊學家使用的數據範例:氨基酸序列比對。

生物資訊學家在哪裡工作以及他們的收入是多少?

生物資訊學路徑傳統上分為兩個主要領域—工業和科學。 生物資訊科學家的職業生涯通常始於大型研究所的研究生職位。 最初,生物資訊學家的基本工資取決於他們所在的研究所、他們參與的資助數量以及他們的隸屬關係(他們正式受僱的地方)的數量。 隨著時間的推移,資助和附屬機構的數量不斷增加,在學術環境中工作大約幾年後,生物資訊學家很容易獲得平均工資(70-80萬盧布),但這很大程度上取決於勤奮和努力。 最有經驗的生物資訊學家最終會在其專業領域中運作自己的實驗室。

我們體內的數據:生物信息學家做什麼?

你在哪裡學習生物資訊學?

  • 莫斯科國立大學 - 生物工程與生物資訊學院
  • HSE - 生物學和醫學數據分析(碩士課程)
  • MIPT-生物資訊學系
  • 生物資訊研究所(NPO)

與學院不同,業內沒有人會花時間教導員工必要的技能,因此實現這一目標通常更加困難。 工業生物資訊學家的職業道路根據其專業和地點的不同而有很大差異。 平均而言,該領域的薪資波動 從 70 萬到 150 千盧布,取決於經驗和專業。 

著名生物資訊學家

生物資訊學的歷史可以追溯到英國科學家弗雷德里克·桑格(Frederick Sanger),他因發現讀取DNA序列的方法而獲得1980年諾貝爾化學獎。 此後,序列讀取方法逐年改進,但「桑格定序」方法成為該領域所有進一步研究的基礎。

我們體內的數據:生物信息學家做什麼?

順便說一句,俄羅斯科學家創建的許多程序現在在世界各地廣泛使用 - 例如基因組組裝程序 SPA, - 英石。 聖彼得堡基因組組裝器由聖彼得堡研究所創建,幫助世界各地的科學家將短DNA序列組裝成更大的序列,以重建生物體的原始基因組。

生物資訊學的發現與成就

如今,生物資訊學家做出了許多有用的發現。 如果不破解其基因組並對疾病過程中發生的過程進行複雜的生物資訊分析,就無法想像冠狀病毒藥物的開發。 國際的  使用比較基因組學和機器學習方法的科學家能夠了解冠狀病毒與其他病原體的共同點。

事實證明,這些特徵之一是病原病毒在演化過程中發生的核定位訊號(NLS)的加強。 這項研究可以幫助研究未來可能對人類造成潛在危險的病毒株,並可能促進預防性藥物的開發。 

此外,生物資訊學家在新的基因組編輯方法的開發中發揮了關鍵作用,特別是CRISPR/Cas9系統(一種基於免疫系統的技術) )。 由於對這些蛋白質結構及其進化發展的生物資訊分析,該系統的準確性和效率近年來顯著提高,這使得有目的地編輯許多生物體(包括人類)的基因組成為可能。

我們體內的數據:生物信息學家做什麼?
您可以透過參加 SkillFactory 線上課程從頭開始獲得受歡迎的職業,或者在技能和薪水方面進行升級:

更多課程

來源: www.habr.com

添加評論