Dữ liệu trong chúng ta: Các nhà tin sinh học làm gì?

Dữ liệu trong chúng ta: Các nhà tin sinh học làm gì?
Chúng ta đang nói về những người trong tương lai giải mã được ngày trọng đại hữu cơ. Trong hai thập kỷ qua, lượng dữ liệu sinh học có thể được phân tích đã tăng lên gấp nhiều lần do trình tự bộ gen của con người. Trước đó, chúng ta thậm chí không thể tưởng tượng rằng bằng cách sử dụng thông tin được lưu trữ trong máu theo đúng nghĩa đen, chúng ta có thể xác định được nguồn gốc của mình, kiểm tra xem cơ thể sẽ phản ứng như thế nào với một số loại thuốc và thậm chí thay đổi khả năng di truyền sinh học của chúng ta.

Bài viết này và các bài viết khác xuất hiện đầu tiên trong bài đăng trên blog trên trang web của chúng tôi. Thích đọc sách.

Các đặc điểm của một nhà tin sinh học bình thường cũng giống như của một lập trình viên - mắt đỏ, tư thế khom lưng và dấu vết từ cốc cà phê trên màn hình. Tuy nhiên, tại bảng này, công việc không dựa trên các thuật toán và lệnh trừu tượng mà dựa trên chính quy luật tự nhiên, điều này có thể cho chúng ta biết nhiều điều về chúng ta và thế giới xung quanh.

Các chuyên gia trong lĩnh vực này xử lý lượng dữ liệu khổng lồ (ví dụ: kết quả giải trình tự bộ gen của một người chiếm khoảng 100 gigabyte). Do đó, việc xử lý một mảng thông tin như vậy đòi hỏi các phương pháp và công cụ Khoa học dữ liệu. Điều hợp lý là một nhà tin sinh học thành công không chỉ hiểu về sinh học và hóa học mà còn cả các phương pháp phân tích dữ liệu, thống kê và toán học - điều này khiến nghề của anh ta trở nên khá hiếm và có nhu cầu. Những chuyên gia như vậy đặc biệt cần thiết trong lĩnh vực y học tiên tiến và phát triển thuốc. Những gã khổng lồ công nghệ như IBM và Intel mở chương trình của họ, dành riêng cho việc nghiên cứu tin sinh học.

Cần những gì để trở thành một nhà tin sinh học?

  • Sinh học và Hóa học (trình độ đại học);
  • Matstat, đại số tuyến tính, lý thuyết xác suất;
  • Ngôn ngữ lập trình (Python và R, cũng thường sử dụng C++);
  • Đối với tin sinh học cấu trúc: hiểu phân tích toán học và lý thuyết về phương trình vi phân.

Bạn có thể tham gia vào lĩnh vực tin sinh học với cả nền tảng sinh học và kiến ​​thức về lập trình và toán học. Đối với cái trước, làm việc với các chương trình tin sinh học làm sẵn là phù hợp, đối với cái sau, một hồ sơ chuyên môn mang tính thuật toán hơn là phù hợp.

Dữ liệu trong chúng ta: Các nhà tin sinh học làm gì?

Các nhà tin sinh học làm gì?

Tin sinh học hiện đại được chia thành hai nhánh chính - tin sinh học cấu trúc và tin sinh học trình tự. Trong trường hợp đầu tiên, chúng ta thấy một người ngồi trước máy tính và chạy các chương trình giúp nghiên cứu các vật thể sinh học (ví dụ: DNA hoặc protein) dưới dạng hình ảnh 3D. Họ xây dựng các mô hình máy tính có thể dự đoán cách thức phân tử thuốc sẽ tương tác với protein, cấu trúc không gian của protein trông như thế nào trong tế bào, đặc tính nào của phân tử giải thích sự tương tác của nó với cấu trúc tế bào, v.v.

Các phương pháp tin sinh học cấu trúc được sử dụng tích cực cả trong khoa học hàn lâm và trong công nghiệp: thật khó để tưởng tượng một công ty dược phẩm có thể làm được nếu không có những chuyên gia như vậy. Trong những năm gần đây, phương pháp máy tính đã đơn giản hóa đáng kể quá trình tìm kiếm các loại thuốc tiềm năng, giúp quá trình phát triển dược phẩm trở nên nhanh hơn và rẻ hơn nhiều.

Dữ liệu trong chúng ta: Các nhà tin sinh học làm gì?
RNA polymerase phụ thuộc RNA của SARS-CoV-2 (trái), cũng như sự liên kết của nó với chuỗi song công RNA. Nguồn.

Bộ gen là gì?

Bộ gen là tất cả thông tin về cấu trúc di truyền của một sinh vật. Ở hầu hết các sinh vật sống, chất mang bộ gen là DNA, nhưng có những sinh vật truyền thông tin di truyền của chúng dưới dạng RNA. Bộ gen được truyền từ cha mẹ sang con cái và trong quá trình truyền tải này, các lỗi gọi là đột biến có thể xảy ra.

Dữ liệu trong chúng ta: Các nhà tin sinh học làm gì?
Sự tương tác của thuốc remdesivir với RNA polymerase phụ thuộc RNA của virus SARS-CoV-2. Nguồn.

Tin sinh học trình tự đề cập đến mức độ tổ chức cao hơn của vật chất sống - từ các nucleotide riêng lẻ, DNA và gen, đến toàn bộ bộ gen và sự so sánh của chúng với nhau.

Hãy tưởng tượng một người nhìn thấy trước mặt mình một tập hợp các chữ cái trong bảng chữ cái (nhưng không phải là một chữ cái đơn giản mà là một chữ cái di truyền hoặc axit amin) và tìm kiếm các mẫu trong đó, giải thích và xác nhận chúng theo thống kê bằng phương pháp máy tính. Tin sinh học trình tự giải thích đột biến nào có liên quan đến một căn bệnh cụ thể hoặc tại sao các chất có hại tích tụ trong máu bệnh nhân. Ngoài dữ liệu y tế, các nhà tin sinh học trình tự còn nghiên cứu các mô hình phân bố của sinh vật trên trái đất, sự khác biệt về quần thể giữa các nhóm động vật cũng như vai trò và chức năng của các gen cụ thể. Nhờ khoa học này, người ta có thể kiểm tra tính hiệu quả của thuốc và nghiên cứu cơ chế sinh học giải thích tác dụng của chúng.

Ví dụ, nhờ phân tích tin sinh học, các đột biến dẫn đến sự phát triển của bệnh xơ nang, một bệnh đơn gen gây ra do sự phá vỡ gen của một trong các kênh clorua, đã được tìm thấy và mô tả. Và bây giờ chúng ta biết rõ hơn ai là họ hàng sinh học gần nhất của con người và tổ tiên của chúng ta định cư trên khắp hành tinh như thế nào. Hơn nữa, mỗi người, bằng cách đọc bộ gen của mình, có thể biết được gia đình mình đến từ đâu và thuộc dân tộc nào. Nhiều người nước ngoài (23andmeMyHeritage) và tiếng Nga (genotekAtlas) cho phép bạn nhận dịch vụ này với mức giá tương đối thấp (khoảng 20 nghìn rúp).

Dữ liệu trong chúng ta: Các nhà tin sinh học làm gì?
Kết quả phân tích xét nghiệm DNA về nguồn gốc và liên kết dân số từ MyHeritage.

Dữ liệu trong chúng ta: Các nhà tin sinh học làm gì?
Kết quả xét nghiệm quần thể DNA từ 23andMe.

Bộ gen được đọc như thế nào?

Ngày nay, giải trình tự bộ gen là một quy trình thông thường khiến mọi người tốn khoảng 150 nghìn rúp (kể cả ở Nga). Để đọc bộ gen của bạn, bạn chỉ cần hiến máu từ tĩnh mạch trong phòng thí nghiệm đặc biệt: trong hai tuần, bạn sẽ nhận được kết quả hoàn chỉnh kèm theo mô tả chi tiết về đặc điểm di truyền của mình. Ngoài bộ gen của mình, bạn có thể phân tích bộ gen của hệ vi sinh vật đường ruột: bạn sẽ tìm hiểu các đặc điểm của vi khuẩn cư trú trong hệ thống tiêu hóa của mình và cũng nhận được lời khuyên từ chuyên gia dinh dưỡng chuyên nghiệp.

Bộ gen có thể được đọc bằng nhiều phương pháp khác nhau, một trong những phương pháp chính hiện nay là cái gọi là “giải trình tự thế hệ tiếp theo”. Để thực hiện quy trình này, trước tiên phải lấy mẫu sinh học. Mọi tế bào trong cơ thể đều có bộ gen giống nhau nên hầu hết thường lấy máu để đọc bộ gen (cách này dễ nhất). Sau đó, các tế bào sẽ phân hủy và tách DNA khỏi mọi thứ khác. Sau đó, DNA thu được được chia thành nhiều mảnh nhỏ và các bộ điều hợp đặc biệt được "khâu" vào từng mảnh - các chuỗi nucleotide đã biết được tổng hợp nhân tạo. Sau đó, các chuỗi DNA được tách ra và các chuỗi đơn được gắn bằng cách sử dụng bộ chuyển đổi vào một tấm đặc biệt để thực hiện giải trình tự. Trong quá trình giải trình tự, các nucleotide có nhãn huỳnh quang bổ sung sẽ được thêm vào trình tự DNA. Mỗi nucleotide được dán nhãn, khi được gắn vào, sẽ phát ra một chùm ánh sáng có bước sóng nhất định, được ghi lại trên máy tính. Đây là cách máy tính đọc các chuỗi DNA ngắn ban đầu, sau đó được lắp ráp thành bộ gen ban đầu bằng các thuật toán đặc biệt.

Dữ liệu trong chúng ta: Các nhà tin sinh học làm gì?
Một ví dụ về dữ liệu mà các nhà tin sinh học xử lý: căn chỉnh trình tự axit amin.

Các nhà tin sinh học làm việc ở đâu và họ kiếm được bao nhiêu?

Con đường tin sinh học theo truyền thống được chia thành hai lĩnh vực chính—công nghiệp và khoa học. Sự nghiệp của một nhà khoa học tin sinh học thường bắt đầu với vị trí tốt nghiệp tại một viện nghiên cứu lớn. Ban đầu, các nhà tin sinh học nhận được mức lương cơ bản dựa trên viện nghiên cứu của họ, số lượng trợ cấp họ tham gia và số lượng đơn vị liên kết của họ - những nơi họ làm việc chính thức. Theo thời gian, số lượng tài trợ và liên kết tăng lên, và sau khoảng vài năm làm việc trong môi trường học thuật, một nhà tin sinh học dễ dàng nhận được mức lương trung bình (70-80 nghìn rúp), nhưng phần lớn phụ thuộc vào sự siêng năng và chăm chỉ. Các nhà tin sinh học giàu kinh nghiệm nhất cuối cùng sẽ điều hành phòng thí nghiệm của riêng họ trong lĩnh vực chuyên môn của họ.

Dữ liệu trong chúng ta: Các nhà tin sinh học làm gì?

Bạn học tin sinh học ở đâu?

  • Đại học quốc gia Moscow - Khoa Kỹ thuật sinh học và Tin sinh học
  • HSE - Phân tích dữ liệu trong sinh học và y học (chương trình thạc sĩ)
  • MIPT - Khoa Tin Sinh Học
  • Viện tin sinh học (NPO)

Không giống như một học viện, không ai trong ngành dành thời gian dạy nhân viên những kỹ năng cần thiết, vì vậy để đạt được điều đó thường khó khăn hơn. Con đường sự nghiệp của một nhà tin sinh học trong ngành rất khác nhau tùy thuộc vào chuyên môn và vị trí của họ. Trung bình, mức lương trong lĩnh vực này dao động từ 70 nghìn đến 150 nghìn rúp, tùy thuộc vào kinh nghiệm và chuyên môn. 

Các nhà tin sinh học nổi tiếng

Lịch sử của tin sinh học có thể bắt nguồn từ Frederick Sanger, một nhà khoa học người Anh đã nhận giải Nobel Hóa học năm 1980 vì đã khám phá ra cách đọc trình tự DNA. Kể từ đó, các phương pháp đọc trình tự đã được cải thiện hàng năm, nhưng phương pháp “trình tự Sanger” được dùng làm cơ sở cho tất cả các nghiên cứu sâu hơn trong lĩnh vực này.

Dữ liệu trong chúng ta: Các nhà tin sinh học làm gì?

Nhân tiện, nhiều chương trình do các nhà khoa học Nga tạo ra hiện đang được sử dụng rộng rãi trên toàn thế giới - ví dụ như trình lắp ráp bộ gen SPAdes, - St. Petersburg, được tạo ra tại Viện St. Petersburg, giúp các nhà khoa học từ khắp nơi trên thế giới tập hợp các chuỗi DNA ngắn thành các chuỗi lớn hơn để tái tạo lại bộ gen ban đầu của sinh vật.

Những khám phá và thành tựu của tin sinh học

Ngày nay, các nhà tin sinh học có nhiều khám phá hữu ích. Sẽ không thể tưởng tượng được sự phát triển của thuốc điều trị coronavirus nếu không giải mã bộ gen của nó và phân tích tin sinh học phức tạp về các quá trình xảy ra trong căn bệnh này. Quốc tế группа Các nhà khoa học sử dụng phương pháp học máy và gen so sánh có thể hiểu được điểm chung của virus Corona với các mầm bệnh khác.

Hóa ra một trong những đặc điểm này là tăng cường tín hiệu định vị hạt nhân (NLS) của virus gây bệnh xảy ra trong quá trình tiến hóa. Nghiên cứu này có thể giúp nghiên cứu các chủng virus có thể gây nguy hiểm cho con người trong tương lai và có thể dẫn tới việc phát triển thuốc phòng ngừa. 

Ngoài ra, các nhà tin sinh học đã đóng một vai trò quan trọng trong việc phát triển các phương pháp chỉnh sửa bộ gen mới, đặc biệt là hệ thống CRISPR/Cas9 (một công nghệ dựa trên hệ thống miễn dịch). vi khuẩn). Nhờ phân tích tin sinh học về cấu trúc của các protein này và sự phát triển tiến hóa của chúng, độ chính xác và hiệu quả của hệ thống này đã tăng lên đáng kể trong những năm gần đây, điều này giúp có thể chỉnh sửa bộ gen của nhiều sinh vật (bao gồm cả con người) một cách có mục đích.

Dữ liệu trong chúng ta: Các nhà tin sinh học làm gì?
Bạn có thể có được một nghề được săn đón ngay từ đầu hoặc Tăng cấp về kỹ năng và mức lương bằng cách tham gia các khóa học trực tuyến SkillFactory:

Các khóa học khác

Nguồn: www.habr.com

Thêm một lời nhận xét