GitHub đã tạo ra một kho lưu trữ nghìn năm, trong đó nó sẽ bảo tồn các kho lưu trữ Nguồn mở cho hậu thế

GitHub đã tạo ra một kho lưu trữ nghìn năm, trong đó nó sẽ bảo tồn các kho lưu trữ Nguồn mở cho hậu thế
Một mỏ than trước đây sẽ là cơ sở lưu trữ của Cơ quan Lưu trữ Thế giới Bắc Cực. Hình ảnh: Guy Martin/Bloomberg Businessweek

Phần mềm miễn phí là nền tảng của nền văn minh hiện đại và là di sản chung của toàn nhân loại. Nhiệm vụ Chương trình lưu trữ GitHub - hãy bảo tồn mật mã này cho các thế hệ tương lai để lịch sử của Thư viện Alexandria sẽ không bao giờ lặp lại.

Để làm được điều này, GitHub sẽ tạo nhiều bản sao lưu trên các phương tiện khác nhau, bao gồm cả bộ nhớ dài hạn Kho mã Bắc Cực trên Spitsbergen. Nó nằm trong một mỏ than cũ ở độ sâu 250 mét trong lớp băng vĩnh cửu và được thiết kế để có thời hạn sử dụng ít nhất 1000 năm.

Ảnh chụp nhanh mã phần mềm của nhân loại sẽ được chụp vào ngày 2 tháng 2020 năm XNUMX.

Dự án lưu trữ dữ liệu dài hạn được triển khai cùng với Long Now Foundation, Internet Archive, Software Heritage Foundation, Arctic World Archive và các đối tác khác.

Dự án LOCKSS

Mã quan trọng ngày nay có thể bị lãng quên hoặc bị mất theo thời gian. Điều tồi tệ nhất là trong trường hợp xảy ra thảm họa toàn cầu, chúng ta sẽ mất tất cả thông tin được lưu trữ trên các phương tiện “phù du”: HDD, SSD, CD và DVD, được thiết kế trong vài thập kỷ, trên các băng có thời hạn sử dụng có điều kiện là 30 năm. kiểm soát chặt chẽ nhiệt độ và độ ẩm.

Giải pháp cho vấn đề này là sao chép các bản sao lưu, tức là lưu trữ phần mềm của một số tổ chức và dưới các hình thức khác nhau. Dự án này có tên KHÓA đã bắt đầu chưa gần 20 năm. Chương trình được trình chiếu vào tháng 2019 năm XNUMX KHÓA 2.0-alpha - nguyên mẫu đầu tiên của phần mềm lưu trữ dữ liệu phân tán trong thời gian dài với sự hỗ trợ cho nhiều người tham gia và bộ nhớ ngoài.

Các nhà thiết kế của hệ thống cho rằng phần cứng có thể bền hơn nhiều so với phương tiện truyền thông phù du: do đó, "có một số tương lai có thể xảy ra trong đó các máy tính hiện đại đang hoạt động tồn tại, nhưng phần mềm của chúng phần lớn đã bị mất."

GitHub nhắc nhở chúng ta về nhiều công nghệ đã mất có thể hữu ích: bê tông la mã (công thức của anh ấy chỉ được khám phá lại vào năm 2014), thuốc chống sốt rét DFDT, mất bản vẽ tên lửa Saturn 5. Thật dễ dàng để tưởng tượng một tương lai trong đó phần mềm ngày nay được coi là một thứ không cần thiết, đã bị lãng quên từ lâu, cho đến khi một nhu cầu bất ngờ xuất hiện: "Giống như bất kỳ bản sao lưu nào, chương trình lưu trữ của GitHub cũng được thiết kế cho một tương lai không thể đoán trước", GitHub của chương trình cho biết. Lưu trữ trang web.

Lưu trữ GitHub

GitHub Archive cung cấp ba cấp độ sao lưu:

  • Nóng: gần như thời gian thực
  • Ấm áp: được cập nhật trong khoảng thời gian từ một tháng đến một năm
  • Lạnh: được cập nhật hơn 5 năm một lần

Sau bất kỳ hành động nào của người dùng GitHub, tất cả dữ liệu Git sẽ được sao chép tới nhiều trung tâm dữ liệu trên toàn thế giới. Các bản sao lưu Git, sự cố, yêu cầu kéo và tất cả dữ liệu người dùng trên GitHub được lưu trữ ở một số nơi. Thông tin này có sẵn trong thời gian thực thông qua API GitHub.

Ngoài ra, việc lập chỉ mục đệ quy được tổ chức bởi trình thu thập thông tin GHTorrent, trình thu thập thông tin này sẽ tải lên các kho lưu trữ hàng ngày hoặc hàng tháng. Thông qua GH Archive, bạn có thể lấy hình ảnh từ kho lưu trữ bằng truy vấn BigQuery. Các bản sao khác của mã được lưu trữ trong Cỗ máy thời gian nổi tiếng của Internet Archive, nơi lưu trữ các bản sao ở nhiều vị trí. Cuối cùng, Tổ chức Di sản Phần mềm sẽ thường xuyên thu thập dữ liệu GitHub và thêm các kho lưu trữ công khai vào kho lưu trữ có API công khai của mình.

Kho lưu trữ GitHub Bắc Cực

Vào ngày 2 tháng 2020 năm XNUMX, GitHub sẽ tạo một bản sao của tất cả các kho lưu trữ công khai đang hoạt động - và đặt chúng vào kho lưu trữ GitHub Arctic.

Dữ liệu sẽ được lưu trữ trên cuộn phim dài 3500 feet do Piql, một công ty Na Uy chuyên lưu trữ dữ liệu dài hạn cung cấp. Theo phép đo ISO, màng polyester halogen bạc này có tuổi thọ 500 năm. Các thử nghiệm lão hóa mô phỏng đã chỉ ra rằng màng Piql lưu giữ thông tin lâu hơn ít nhất gấp đôi.

Ngoài ra, GitHub Archive đang cộng tác với các nhà nghiên cứu dự án Microsoft Silica để ghi tất cả các kho lưu trữ công cộng lên các tấm thủy tinh thạch anh bằng cách sử dụng tia laser femto giây. Phương tiện này sẽ đảm bảo an toàn dữ liệu trong hơn 10 năm.

Kho lưu trữ mã GitHub Bắc Cực được tạo trên cơ sở Kho lưu trữ Thế giới Bắc Cực (AWA) ở độ sâu 250 mét trong lớp băng vĩnh cửu. Kho lưu trữ nằm trong một mỏ than cũ trên quần đảo Spitsbergen, cách Bắc Cực không xa lắm. Sự nóng lên toàn cầu sẽ chỉ ảnh hưởng đến vài mét lớp băng vĩnh cửu và không đe dọa đến mỏ trong tương lai gần (vài nghìn năm).

Svalbard được quy định Hiệp ước quốc tế giống như một khu phi quân sự. Theo GitHub, đây là một trong những khu định cư xa xôi và ổn định về mặt địa chính trị của con người trên Trái đất. Gần đó là World Seed Vault nổi tiếng, niềm hy vọng chính của nhân loại trong trường hợp tận thế.

GitHub đã tạo ra một kho lưu trữ nghìn năm, trong đó nó sẽ bảo tồn các kho lưu trữ Nguồn mở cho hậu thế
Hầm hạt giống toàn cầu ở Svalbard

AWA là sáng kiến ​​chung giữa công ty khai thác mỏ nhà nước Na Uy Norske Spitsbergen Kulkompani (SNSK) và nhà cung cấp dịch vụ bảo quản kỹ thuật số Piql AS. Dữ liệu lịch sử và văn hóa từ Ý, Brazil, Na Uy, Vatican và các quốc gia khác đã được lưu trữ ở đó.

GitHub đã tạo ra một kho lưu trữ nghìn năm, trong đó nó sẽ bảo tồn các kho lưu trữ Nguồn mở cho hậu thế
Hình ảnh: Guy Martin/Bloomberg Businessweek

Các cuộn mã GitHub sẽ được lưu trữ trong một thùng chứa có mặt thép bên trong buồng kín. Ảnh chụp nhanh ngày 02.02.2020 sẽ bao gồm tất cả các kho lưu trữ GitHub đang hoạt động và một phần đáng kể của các kho lưu trữ không hoạt động (đánh giá theo số sao, phần phụ thuộc, v.v.), tất cả các tệp nhị phân lên tới 100 KB. Mỗi kho lưu trữ trong một tệp tar riêng biệt. Mọi thứ phải vừa với 200 cuộn 120 GB.

Cùng với kho lưu trữ sẽ là một danh mục mà con người có thể đọc được và hướng dẫn kỹ thuật về giải mã QR, định dạng tệp, mã hóa ký tự và siêu dữ liệu quan trọng khác để con cháu có thể chuyển đổi dữ liệu trở lại mã nguồn.

Kho lưu trữ cũng sẽ bao gồm hướng dẫn chung về Sơ đồ công nghệ trong trường hợp người đọc trong tương lai hết máy tính hoạt động và phải xây dựng lại công nghệ từ đầu.

Nguồn: www.habr.com

Mua dịch vụ lưu trữ đáng tin cậy cho các trang web có bảo vệ DDoS, máy chủ VPS VDS 🔥 Mua dịch vụ hosting website đáng tin cậy với bảo vệ DDoS, máy chủ VPS VDS | ProHoster