我们谈论的是未来的人们,他们破译了有机大日期。 在过去的二十年中,由于人类基因组测序,可分析的生物数据量增加了许多倍。 在此之前,我们甚至无法想象,利用储存在我们血液中的信息,可以确定我们的起源,检查身体对某些药物的反应,甚至改变我们的生物遗传。
这篇文章和其他文章首先出现在
一般生物信息学家的特征与程序员相同——红眼睛、弯腰驼背、桌面上咖啡杯留下的痕迹。 然而,这张桌子上的工作不是抽象的算法和命令,而是自然的代码本身,它可以告诉我们很多关于我们自己和我们周围世界的信息。
该领域的专家处理大量数据(例如,一个人的基因组测序结果约占 100 GB)。 因此,处理如此大量的信息需要数据科学方法和工具。 顺理成章的是,一个成功的生物信息学家不仅应该了解生物学和化学,还应该了解数据分析方法、统计学和数学——这使得他的职业相当稀有且需求旺盛。 创新医学和药物开发领域尤其需要此类专家。 IBM、英特尔等科技巨头
成为一名生物信息学家需要什么?
- 生物学和化学(大学水平);
- Matstat、线性代数、概率论;
- 编程语言(Python和R,通常也使用C++);
- 对于结构生物信息学:理解数学分析和微分方程理论。
您可以凭借生物学背景以及编程和数学知识进入生物信息学领域。 对于前者,使用现成的生物信息学程序是合适的,而对于后者,则适合使用更算法化的专业概况。
生物信息学家做什么的?
现代生物信息学分为两个主要分支——结构生物信息学和序列生物信息学。 在第一种情况下,我们看到一个人坐在计算机前运行程序,帮助研究 3D 可视化中的生物对象(例如 DNA 或蛋白质)。 他们建立了计算机模型,可以预测药物分子如何与蛋白质相互作用、蛋白质在细胞中的空间结构是什么样子、分子的哪些特性解释了其与细胞结构的相互作用等。
结构生物信息学方法在学术科学和工业界都得到了积极的应用:很难想象一家制药公司可以没有这样的专家。 近年来,计算机方法极大地简化了寻找潜在药物的过程,使药物开发过程变得更快、更便宜。
SARS-CoV-2 RNA 依赖性 RNA 聚合酶(左)及其与 RNA 双链体的关联。
什么是基因组?
基因组是有关生物体遗传结构的所有信息。 在几乎所有生物中,基因组的载体是DNA,但也有一些生物体以RNA的形式传递遗传信息。 基因组从父母传递给孩子,在这个传递过程中,可能会发生称为突变的错误。
药物瑞德西韦与 SARS-CoV-2 病毒的 RNA 依赖性 RNA 聚合酶的相互作用。
序列生物信息学涉及生命物质的更高层次的组织——从单个核苷酸、DNA 和基因,到整个基因组及其相互比较。
想象一个人在他面前看到一组字母(但不是简单的字母,而是遗传或氨基酸的字母)并寻找其中的模式,使用计算机方法从统计上解释和确认它们。 序列生物信息学解释了哪种突变与特定疾病相关,或者为什么有害物质会在患者的血液中积聚。 除了医学数据之外,序列生物信息学家还研究地球上生物体的分布模式、动物群体之间的种群差异以及特定基因的作用和功能。 借助这门科学,我们可以测试药物的有效性并研究解释其作用的生物机制。
例如,通过生物信息学分析,发现并描述了导致囊性纤维化发展的突变,囊性纤维化是一种由氯通道基因故障引起的单基因疾病。 现在我们更加清楚谁是人类最亲近的生物学亲戚,以及我们的祖先如何在地球上定居。 而且,每个人通过读取他的基因组,都可以知道他的家庭来自哪里,属于哪个种族。 许多外国(
来自 MyHeritage 的起源和人口归属的 DNA 测试分析结果。
23andMe 的 DNA 群体测试结果。
基因组是如何读取的?
如今,基因组测序已成为一项常规程序,任何人都将花费大约
可以使用不同的方法读取基因组,目前主要的方法之一是所谓的“下一代测序”。 为了执行此过程,必须首先获得生物样本。 身体的每个细胞都有相同的基因组,因此最常见的是抽取血液来读取基因组(这是最简单的)。 然后细胞分解并将 DNA 与其他物质分离。 然后,所得的 DNA 被分成许多小片段,并将特殊的接头“缝合”到每个小片段上 - 人工合成的已知核苷酸序列。 然后分离 DNA 链,并使用接头将单链连接到特殊的板上,并在该板上进行测序。 在测序过程中,互补的荧光标记核苷酸被添加到 DNA 序列中。 每个标记的核苷酸在附着时会发出特定波长的光束,该光束会记录在计算机上。 这就是计算机读取原始 DNA 短序列的方式,然后使用特殊算法将其组装成原始基因组。
生物信息学家使用的数据示例:氨基酸序列比对。
生物信息学家在哪里工作以及他们的收入是多少?
生物信息学路径传统上分为两个主要领域——工业和科学。 生物信息学科学家的职业生涯通常始于大型研究所的研究生职位。 最初,生物信息学家的基本工资取决于他们所在的研究所、他们参与的资助数量以及他们的隶属关系(他们正式受雇的地方)的数量。 随着时间的推移,资助和附属机构的数量不断增加,在学术环境中工作大约几年后,生物信息学家很容易获得平均工资(70-80万卢布),但这很大程度上取决于勤奋和努力。 最有经验的生物信息学家最终会在其专业领域运营自己的实验室。
你在哪里学习生物信息学?
- 莫斯科国立大学 - 生物工程与生物信息学学院
- HSE - 生物学和医学数据分析(硕士课程)
- MIPT-生物信息学系
- 生物信息研究所(NPO)
与学院不同,业内没有人会花时间教授员工必要的技能,因此实现这一目标通常更加困难。 工业生物信息学家的职业道路根据其专业和地点的不同而有很大差异。 平均而言,该领域的薪资波动
著名生物信息学家
生物信息学的历史可以追溯到英国科学家弗雷德里克·桑格(Frederick Sanger),他因发现读取DNA序列的方法而获得1980年诺贝尔化学奖。 此后,序列读取方法逐年改进,但“桑格测序”方法成为该领域所有进一步研究的基础。
顺便说一句,俄罗斯科学家创建的许多程序现在在世界各地广泛使用 - 例如基因组组装程序
生物信息学的发现和成就
如今,生物信息学家做出了许多有用的发现。 如果不破译其基因组并对疾病过程中发生的过程进行复杂的生物信息学分析,就无法想象冠状病毒药物的开发。 国际的
事实证明,这些特征之一是病原病毒在进化过程中发生的核定位信号(NLS)的增强。 这项研究可以帮助研究未来可能对人类造成潜在危险的病毒株,并可能促进预防性药物的开发。
此外,生物信息学家在新的基因组编辑方法的开发中发挥了关键作用,特别是CRISPR/Cas9系统(一种基于免疫系统的技术)
您可以通过参加 SkillFactory 在线课程从头开始获得受欢迎的职业,或者在技能和薪水方面进行升级:更多课程
来源: habr.com