Đại dịch COVID-19 hiện nay đã tạo ra nhiều vấn đề mà hacker vui vẻ tấn công. Từ tấm che mặt in 3D và khẩu trang y tế tự chế cho đến việc thay thế toàn bộ máy thở cơ học, dòng ý tưởng đã truyền cảm hứng và ấm lòng. Đồng thời, có những nỗ lực tiến lên trong một lĩnh vực khác: nghiên cứu nhằm mục đích chống lại chính virus.
Rõ ràng, tiềm năng lớn nhất để ngăn chặn đại dịch hiện tại và vượt qua tất cả những đại dịch tiếp theo nằm ở cách tiếp cận cố gắng đi đến tận gốc rễ của vấn đề. Cách tiếp cận “biết kẻ thù của bạn” này được thực hiện bởi dự án điện toán Folding@Home. Hàng triệu người đã đăng ký tham gia dự án và quyên góp một phần sức mạnh xử lý của bộ xử lý và GPU của họ, từ đó tạo ra siêu máy tính [phân phối] lớn nhất trong lịch sử.
Nhưng chính xác thì tất cả những exaflop này được dùng để làm gì? Tại sao cần phải ném sức mạnh tính toán như vậy vào
Đầu tiên, điều quan trọng nhất: tại sao lại cần protein?
Protein là cấu trúc quan trọng. Chúng không chỉ cung cấp vật liệu xây dựng cho tế bào mà còn đóng vai trò là chất xúc tác enzyme cho hầu hết các phản ứng sinh hóa. Sóc, có thể là chúng
Để hiểu làm thế nào protein có được cấu trúc xác định chức năng của chúng, chúng ta cần tìm hiểu những kiến thức cơ bản về sinh học phân tử và luồng thông tin trong tế bào.
Sản xuất hoặc
Ribosome hoạt động giống như những cỗ máy lắp ráp - chúng lấy mẫu mRNA và ghép nó với những mảnh RNA nhỏ khác,
Trình tự axit amin này là cấp độ đầu tiên trong hệ thống phân cấp cấu trúc protein, đó là lý do tại sao nó được gọi là
Liên kết tầm xa của các bộ phận protein
Cấp độ cấu trúc ba chiều tiếp theo, vượt xa cấp độ chính, được đặt một cái tên thông minh
Các chuỗi xoắn alpha và các tấm beta trong protein. Liên kết hydro hình thành trong quá trình biểu hiện protein.
Hai cấu trúc này và sự kết hợp của chúng tạo thành cấp độ cấu trúc protein tiếp theo -
Ngoài ra, sự ổn định của cấu trúc bậc ba được đảm bảo bằng liên kết tầm xa giữa các axit amin. Một ví dụ kinh điển về những kết nối như vậy là
Cấu trúc bậc ba được ổn định nhờ các tương tác tầm xa như liên kết kỵ nước hoặc liên kết disulfide
Liên kết disulphide có thể xảy ra giữa
Mô hình hóa cấu trúc để tìm kiếm phương pháp chữa bệnh
Các chuỗi polypeptide bắt đầu gấp lại thành hình dạng cuối cùng trong quá trình dịch mã, khi chuỗi đang phát triển thoát ra khỏi ribosome, giống như một đoạn dây hợp kim trí nhớ có thể có hình dạng phức tạp khi bị nung nóng. Tuy nhiên, như mọi khi trong sinh học, mọi thứ không đơn giản như vậy.
Ở nhiều tế bào, các gen phiên mã trải qua quá trình chỉnh sửa rộng rãi trước khi dịch mã, làm thay đổi đáng kể cấu trúc cơ bản của protein so với trình tự base thuần túy của gen. Trong trường hợp này, các cơ chế dịch mã thường tranh thủ sự trợ giúp của các chất đi kèm phân tử, các protein liên kết tạm thời với chuỗi polypeptide mới sinh và ngăn không cho nó chuyển sang bất kỳ dạng trung gian nào, từ đó chúng sẽ không thể chuyển sang dạng cuối cùng.
Tất cả những điều này để nói lên rằng việc dự đoán hình dạng cuối cùng của protein không phải là một nhiệm vụ tầm thường. Trong nhiều thập kỷ, cách duy nhất để nghiên cứu cấu trúc của protein là thông qua các phương pháp vật lý như tinh thể học tia X. Mãi đến cuối những năm 1960, các nhà hóa lý sinh học mới bắt đầu xây dựng các mô hình tính toán về quá trình gấp protein, chủ yếu tập trung vào mô hình cấu trúc thứ cấp. Những phương pháp này và các phương pháp tiếp theo của chúng đòi hỏi lượng dữ liệu đầu vào khổng lồ ngoài cấu trúc sơ cấp - ví dụ: các bảng góc liên kết axit amin, danh sách tính kỵ nước, trạng thái tích điện và thậm chí bảo toàn cấu trúc và chức năng trong khoảng thời gian tiến hóa - tất cả để đoán xem điều gì sẽ xảy ra giống như protein cuối cùng.
Các phương pháp tính toán ngày nay để dự đoán cấu trúc thứ cấp, chẳng hạn như các phương pháp chạy trên mạng Folding@Home, hoạt động với độ chính xác khoảng 80% — khá tốt nếu xét đến mức độ phức tạp của vấn đề. Dữ liệu được tạo ra bởi các mô hình dự đoán về các protein như protein tăng đột biến của SARS-CoV-2 sẽ được so sánh với dữ liệu từ các nghiên cứu vật lý về virus. Kết quả là, sẽ có thể thu được cấu trúc chính xác của protein và có lẽ hiểu được cách thức virus bám vào các thụ thể.
Nghiên cứu gấp protein là trọng tâm trong sự hiểu biết của chúng tôi về rất nhiều bệnh tật và nhiễm trùng mà ngay cả khi chúng tôi sử dụng mạng Folding@Home để tìm ra cách đánh bại COVID-19, thứ mà chúng tôi thấy đang bùng nổ trong thời gian gần đây, mạng đã chiến thắng' Đừng nhàn rỗi lâu. Đây là một công cụ nghiên cứu rất phù hợp để nghiên cứu các mẫu protein gây ra hàng chục bệnh liên quan đến protein sai lệch, chẳng hạn như bệnh Alzheimer hoặc biến thể bệnh Creutzfeldt-Jakob, thường được gọi không chính xác là bệnh bò điên. Và khi một loại virus khác chắc chắn xuất hiện, chúng ta sẽ sẵn sàng bắt đầu chiến đấu lại với nó.
Nguồn: www.habr.com