Vậy chính xác thì “protein gấp” là gì?

Vậy chính xác thì “protein gấp” là gì?

Đại dịch COVID-19 hiện nay đã tạo ra nhiều vấn đề mà hacker vui vẻ tấn công. Từ tấm che mặt in 3D và khẩu trang y tế tự chế cho đến việc thay thế toàn bộ máy thở cơ học, dòng ý tưởng đã truyền cảm hứng và ấm lòng. Đồng thời, có những nỗ lực tiến lên trong một lĩnh vực khác: nghiên cứu nhằm mục đích chống lại chính virus.

Rõ ràng, tiềm năng lớn nhất để ngăn chặn đại dịch hiện tại và vượt qua tất cả những đại dịch tiếp theo nằm ở cách tiếp cận cố gắng đi đến tận gốc rễ của vấn đề. Cách tiếp cận “biết kẻ thù của bạn” này được thực hiện bởi dự án điện toán Folding@Home. Hàng triệu người đã đăng ký tham gia dự án và quyên góp một phần sức mạnh xử lý của bộ xử lý và GPU của họ, từ đó tạo ra siêu máy tính [phân phối] lớn nhất trong lịch sử.

Nhưng chính xác thì tất cả những exaflop này được dùng để làm gì? Tại sao cần phải ném sức mạnh tính toán như vậy vào gấp protein? Loại sinh hóa nào đang hoạt động ở đây, tại sao protein lại cần phải gấp nếp? Dưới đây là tổng quan nhanh về quá trình gấp protein: nó là gì, nó xảy ra như thế nào và tại sao nó lại quan trọng.

Đầu tiên, điều quan trọng nhất: tại sao lại cần protein?

Protein là cấu trúc quan trọng. Chúng không chỉ cung cấp vật liệu xây dựng cho tế bào mà còn đóng vai trò là chất xúc tác enzyme cho hầu hết các phản ứng sinh hóa. Sóc, có thể là chúng cấu trúc hoặc enzym, là những chuỗi dài axit amin, nằm theo một trình tự nhất định. Chức năng của protein được xác định bởi vị trí của các axit amin nhất định trên protein. Ví dụ, nếu một protein cần liên kết với một phân tử tích điện dương thì vị trí liên kết phải chứa đầy các axit amin tích điện âm.

Để hiểu làm thế nào protein có được cấu trúc xác định chức năng của chúng, chúng ta cần tìm hiểu những kiến ​​​​thức cơ bản về sinh học phân tử và luồng thông tin trong tế bào.

Sản xuất hoặc biểu hiện protein bắt đầu bằng quá trình phiên âm. Trong quá trình phiên mã, chuỗi xoắn kép DNA, chứa thông tin di truyền của tế bào, sẽ giãn ra một phần, cho phép các bazơ nitơ của DNA trở nên sẵn sàng cho một enzyme gọi là ARN polymerase. Công việc của RNA polymerase là tạo ra một bản sao RNA hoặc phiên mã của gen. Bản sao của gen này được gọi là ARN thông tin (mRNA), là một phân tử đơn lẻ lý tưởng để kiểm soát các nhà máy sản xuất protein nội bào, ribosomenhững người đang tham gia sản xuất, hoặc phát tin protein.

Ribosome hoạt động giống như những cỗ máy lắp ráp - chúng lấy mẫu mRNA và ghép nó với những mảnh RNA nhỏ khác, chuyển ARN (tRNA). Mỗi tRNA có hai vùng hoạt động - một phần gồm ba bazơ được gọi là anticodon, phải phù hợp với các codon tương ứng của mRNA và vị trí liên kết với một axit amin đặc hiệu cho điều này codon. Trong quá trình dịch mã, các phân tử tRNA trong ribosome cố gắng liên kết ngẫu nhiên với mRNA bằng cách sử dụng các anticodon. Nếu thành công, phân tử tRNA sẽ gắn axit amin của nó vào phân tử trước đó, tạo thành liên kết tiếp theo trong chuỗi axit amin được mã hóa bởi mRNA.

Trình tự axit amin này là cấp độ đầu tiên trong hệ thống phân cấp cấu trúc protein, đó là lý do tại sao nó được gọi là cấu trúc chính. Toàn bộ cấu trúc ba chiều của protein và các chức năng của nó có nguồn gốc trực tiếp từ cấu trúc bậc một và phụ thuộc vào các đặc tính khác nhau của từng axit amin và sự tương tác của chúng với nhau. Nếu không có những đặc tính hóa học và tương tác axit amin này, polipeptit chúng sẽ vẫn là các chuỗi tuyến tính mà không có cấu trúc ba chiều. Điều này có thể được nhìn thấy mỗi khi bạn nấu thức ăn - trong quá trình này có nhiệt biến tính cấu trúc ba chiều của protein.

Liên kết tầm xa của các bộ phận protein

Cấp độ cấu trúc ba chiều tiếp theo, vượt xa cấp độ chính, được đặt một cái tên thông minh cấu trúc thứ cấp. Nó bao gồm các liên kết hydro giữa các axit amin có tác dụng tương đối chặt chẽ. Bản chất chính của những tương tác ổn định này có hai điều: xoắn alpha и danh sách beta. Chuỗi xoắn alpha tạo thành vùng cuộn chặt của polypeptide, trong khi tấm beta tạo thành vùng mịn, rộng. Cả hai dạng này đều có cả đặc tính cấu trúc và chức năng, tùy thuộc vào đặc điểm của các axit amin cấu thành của chúng. Ví dụ: nếu chuỗi xoắn alpha bao gồm chủ yếu là các axit amin ưa nước, như arginine hoặc lysine, thì rất có thể nó sẽ tham gia vào các phản ứng nước.

Vậy chính xác thì “protein gấp” là gì?
Các chuỗi xoắn alpha và các tấm beta trong protein. Liên kết hydro hình thành trong quá trình biểu hiện protein.

Hai cấu trúc này và sự kết hợp của chúng tạo thành cấp độ cấu trúc protein tiếp theo - cấu trúc đại học. Không giống như các mảnh đơn giản của cấu trúc bậc hai, cấu trúc bậc ba chủ yếu bị ảnh hưởng bởi tính kỵ nước. Phần trung tâm của hầu hết các protein đều chứa các axit amin kỵ nước cao, chẳng hạn như alanin hoặc methionine, và nước bị loại khỏi đó do tính chất "nhờn" của các gốc tự do. Những cấu trúc này thường xuất hiện trong các protein xuyên màng được gắn vào màng tế bào hai lớp lipid bao quanh. Các vùng kỵ nước của protein vẫn ổn định về mặt nhiệt động bên trong phần mỡ của màng, trong khi các vùng ưa nước của protein tiếp xúc với môi trường nước ở cả hai mặt.

Ngoài ra, sự ổn định của cấu trúc bậc ba được đảm bảo bằng liên kết tầm xa giữa các axit amin. Một ví dụ kinh điển về những kết nối như vậy là cầu disulfua, thường xảy ra giữa hai gốc cystein. Nếu bạn ngửi thấy mùi gì đó giống như trứng thối trong tiệm làm tóc trong quá trình uốn tóc của khách hàng, thì đây là sự biến tính một phần cấu trúc cấp ba của keratin có trong tóc, xảy ra thông qua việc giảm liên kết disulfide với sự giúp đỡ của lưu huỳnh thiol hỗn hợp.

Vậy chính xác thì “protein gấp” là gì?
Cấu trúc bậc ba được ổn định nhờ các tương tác tầm xa như liên kết kỵ nước hoặc liên kết disulfide

Liên kết disulphide có thể xảy ra giữa cystein các gốc trong cùng một chuỗi polypeptide hoặc giữa các cystein từ các chuỗi hoàn chỉnh khác nhau. Tương tác giữa các chuỗi khác nhau hình thành bậc bốn mức độ cấu trúc của protein. Một ví dụ điển hình về cấu trúc bậc bốn là huyết sắc tố nó ở trong máu của bạn. Mỗi phân tử hemoglobin bao gồm bốn phần protein, globin giống hệt nhau, mỗi phần được giữ ở một vị trí cụ thể trong polypeptide bằng cầu nối disulfide và cũng liên kết với một phân tử heme có chứa sắt. Tất cả bốn globin được kết nối bằng cầu nối disulfide liên phân tử và toàn bộ phân tử liên kết với một số phân tử không khí cùng một lúc, tối đa bốn phân tử và có thể giải phóng chúng khi cần thiết.

Mô hình hóa cấu trúc để tìm kiếm phương pháp chữa bệnh

Các chuỗi polypeptide bắt đầu gấp lại thành hình dạng cuối cùng trong quá trình dịch mã, khi chuỗi đang phát triển thoát ra khỏi ribosome, giống như một đoạn dây hợp kim trí nhớ có thể có hình dạng phức tạp khi bị nung nóng. Tuy nhiên, như mọi khi trong sinh học, mọi thứ không đơn giản như vậy.

Ở nhiều tế bào, các gen phiên mã trải qua quá trình chỉnh sửa rộng rãi trước khi dịch mã, làm thay đổi đáng kể cấu trúc cơ bản của protein so với trình tự base thuần túy của gen. Trong trường hợp này, các cơ chế dịch mã thường tranh thủ sự trợ giúp của các chất đi kèm phân tử, các protein liên kết tạm thời với chuỗi polypeptide mới sinh và ngăn không cho nó chuyển sang bất kỳ dạng trung gian nào, từ đó chúng sẽ không thể chuyển sang dạng cuối cùng.

Tất cả những điều này để nói lên rằng việc dự đoán hình dạng cuối cùng của protein không phải là một nhiệm vụ tầm thường. Trong nhiều thập kỷ, cách duy nhất để nghiên cứu cấu trúc của protein là thông qua các phương pháp vật lý như tinh thể học tia X. Mãi đến cuối những năm 1960, các nhà hóa lý sinh học mới bắt đầu xây dựng các mô hình tính toán về quá trình gấp protein, chủ yếu tập trung vào mô hình cấu trúc thứ cấp. Những phương pháp này và các phương pháp tiếp theo của chúng đòi hỏi lượng dữ liệu đầu vào khổng lồ ngoài cấu trúc sơ cấp - ví dụ: các bảng góc liên kết axit amin, danh sách tính kỵ nước, trạng thái tích điện và thậm chí bảo toàn cấu trúc và chức năng trong khoảng thời gian tiến hóa - tất cả để đoán xem điều gì sẽ xảy ra giống như protein cuối cùng.

Các phương pháp tính toán ngày nay để dự đoán cấu trúc thứ cấp, chẳng hạn như các phương pháp chạy trên mạng Folding@Home, hoạt động với độ chính xác khoảng 80% — khá tốt nếu xét đến mức độ phức tạp của vấn đề. Dữ liệu được tạo ra bởi các mô hình dự đoán về các protein như protein tăng đột biến của SARS-CoV-2 sẽ được so sánh với dữ liệu từ các nghiên cứu vật lý về virus. Kết quả là, sẽ có thể thu được cấu trúc chính xác của protein và có lẽ hiểu được cách thức virus bám vào các thụ thể. enzym chuyển angiotensin 2 người nằm trong đường hô hấp dẫn vào cơ thể. Nếu chúng ta có thể tìm ra cấu trúc này, chúng ta có thể tìm ra các loại thuốc ngăn chặn sự liên kết và ngăn ngừa nhiễm trùng.

Nghiên cứu gấp protein là trọng tâm trong sự hiểu biết của chúng tôi về rất nhiều bệnh tật và nhiễm trùng mà ngay cả khi chúng tôi sử dụng mạng Folding@Home để tìm ra cách đánh bại COVID-19, thứ mà chúng tôi thấy đang bùng nổ trong thời gian gần đây, mạng đã chiến thắng' Đừng nhàn rỗi lâu. Đây là một công cụ nghiên cứu rất phù hợp để nghiên cứu các mẫu protein gây ra hàng chục bệnh liên quan đến protein sai lệch, chẳng hạn như bệnh Alzheimer hoặc biến thể bệnh Creutzfeldt-Jakob, thường được gọi không chính xác là bệnh bò điên. Và khi một loại virus khác chắc chắn xuất hiện, chúng ta sẽ sẵn sàng bắt đầu chiến đấu lại với nó.

Nguồn: www.habr.com

Thêm một lời nhận xét