GitHub telah menciptakan repositori seribu tahun yang akan melestarikan repositori Open Source untuk anak cucu

GitHub telah menciptakan repositori seribu tahun yang akan melestarikan repositori Open Source untuk anak cucu
Bekas tambang batu bara yang akan menampung fasilitas penyimpanan Arsip Dunia Arktik. foto: Guy Martin/Pekan Bisnis Bloomberg

Perangkat lunak bebas adalah landasan peradaban modern dan warisan bersama seluruh umat manusia. Misi Program Arsip GitHub - lestarikan kode ini untuk generasi mendatang agar sejarah Perpustakaan Alexandria tidak terulang kembali.

Untuk melakukan ini, GitHub akan membuat banyak salinan cadangan di berbagai media, termasuk penyimpanan jangka panjang Gudang Kode Arktik di Spitsbergen. Itu terletak di bekas tambang batu bara pada kedalaman 250 meter di lapisan es dan dirancang untuk umur simpan minimal 1000 tahun.

Cuplikan kode perangkat lunak umat manusia akan diambil pada tanggal 2 Februari 2020.

Proyek penyimpanan data jangka panjang diluncurkan bersama dengan Long Now Foundation, Internet Archive, Software Heritage Foundation, Arctic World Archive dan mitra lainnya.

KUNCI Proyek

Kode yang penting saat ini bisa saja terlupakan atau hilang seiring berjalannya waktu. Hal terburuknya adalah jika terjadi bencana global kita akan kehilangan semua informasi yang disimpan di media β€œsementara”: HDD, SSD, CD dan DVD, yang dirancang selama beberapa dekade, pada kaset yang masa pakainya memerlukan waktu 30 tahun. kontrol ketat terhadap suhu dan kelembaban.

Solusi dari masalah ini adalah duplikasi backup, yaitu pengarsipan perangkat lunak oleh banyak organisasi dan dalam bentuk yang berbeda. Proyek ini disebut LOCKSS sudah dimulai hampir 20 tahun. Program ini dipresentasikan pada Mei 2019 LOCKSS 2.0-alfa - prototipe pertama perangkat lunak untuk penyimpanan data terdistribusi dalam waktu lama dengan dukungan untuk banyak peserta dan penyimpanan eksternal.

Perancang sistem ini berasumsi bahwa perangkat keras bisa jauh lebih tahan lama dibandingkan media yang tidak bertahan lama: oleh karena itu, "ada sejumlah kemungkinan masa depan di mana komputer modern masih dapat berfungsi, namun sebagian besar perangkat lunaknya telah hilang."

GitHub mengingatkan kita akan banyak teknologi hilang yang sebenarnya bisa berguna: beton Romawi (resepnya baru ditemukan kembali pada tahun 2014), DFDT obat antimalaria, hilang gambar roket Saturn 5. Sangat mudah untuk membayangkan masa depan di mana perangkat lunak saat ini dipandang sebagai sesuatu yang kuno dan tidak penting yang telah lama terlupakan, hingga muncul kebutuhan yang tidak terduga: "Seperti cadangan lainnya, program arsip GitHub juga dirancang untuk masa depan yang tidak terduga," kata GitHub dari program tersebut. Arsip situs web.

Arsip GitHub

Arsip GitHub menyediakan tiga tingkat pencadangan:

  • Panas: hampir waktu nyata
  • Hangat: diperbarui dengan interval dari satu bulan hingga satu tahun
  • Dingin: diperbarui setiap 5+ tahun

Setelah tindakan apa pun yang dilakukan pengguna GitHub, semua data Git direplikasi ke beberapa pusat data di seluruh dunia. Cadangan Git, masalah, permintaan penarikan, dan semua data pengguna di GitHub disimpan di beberapa tempat. Informasi ini tersedia secara real time melalui GitHub API.

Selain itu, pengindeksan rekursif diatur oleh crawler GHTorrent, yang akan mengunggah arsip setiap hari atau bulanan. Melalui GH Archive, gambar dari arsip dapat diperoleh menggunakan kueri BigQuery. Salinan kode lainnya disimpan di Time Machine Internet Archive yang terkenal, yang menyimpan salinan di banyak lokasi. Terakhir, Software Heritage Foundation akan secara rutin meng-crawl GitHub dan menambahkan repositori publiknya ke arsipnya, yang memiliki API publik.

Repositori GitHub Arktik

Pada tanggal 2 Februari 2020, GitHub akan membuat salinan semua repositori publik yang aktif dan menempatkannya di repositori GitHub Arctic.

Data tersebut akan disimpan pada gulungan film sepanjang 3500 kaki yang disediakan oleh Piql, sebuah perusahaan Norwegia yang berspesialisasi dalam penyimpanan data jangka panjang. Menurut pengukuran ISO, film poliester perak halida ini memiliki umur 500 tahun. Uji simulasi penuaan menunjukkan bahwa film Piql menyimpan informasi setidaknya dua kali lebih lama.

Selain itu, Arsip GitHub berkolaborasi dengan peneliti proyek Microsoft Silica untuk membakar semua repositori publik ke wafer kaca kuarsa menggunakan laser femtosecond. Media ini akan menjamin keamanan data selama lebih dari 10 tahun.

Repositori kode GitHub Arktik dibuat berdasarkan Arsip Dunia Arktik (AWA) pada kedalaman 250 meter di lapisan es. Arsip tersebut terletak di bekas tambang batu bara di kepulauan Spitsbergen, yang tidak jauh dari Kutub Utara. Pemanasan global hanya akan mempengaruhi beberapa meter lapisan es dan tidak mengancam tambang dalam waktu dekat (beberapa ribu tahun).

Svalbard diatur perjanjian internasional seperti zona demiliterisasi. Ini adalah salah satu pemukiman manusia paling terpencil dan stabil secara geopolitik di Bumi, menurut GitHub. Di dekatnya terdapat Gudang Benih Dunia yang terkenal, harapan utama umat manusia jika terjadi kiamat.

GitHub telah menciptakan repositori seribu tahun yang akan melestarikan repositori Open Source untuk anak cucu
Gudang Benih Dunia di Svalbard

AWA adalah inisiatif bersama antara perusahaan pertambangan milik negara Norwegia Norske Spitsbergen Kulkompani (SNSK) dan penyedia pelestarian digital Piql AS. Data sejarah dan budaya dari Italia, Brazil, Norwegia, Vatikan dan negara-negara lain sudah tersimpan di sana.

GitHub telah menciptakan repositori seribu tahun yang akan melestarikan repositori Open Source untuk anak cucu
foto: Guy Martin/Pekan Bisnis Bloomberg

Gulungan kode GitHub akan disimpan dalam wadah bersisi baja di dalam ruang tertutup. Cuplikan 02.02.2020 akan mencakup semua repositori GitHub yang aktif dan sebagian besar repositori yang tidak aktif (dilihat dari bintang, dependensi, dll.), semua file biner hingga 100 KB. Setiap repositori dalam file tar terpisah. Semuanya harus muat pada 200 gulungan 120GB.

Bersamaan dengan arsip tersebut akan terdapat katalog yang dapat dibaca manusia dan manual teknis tentang decoding QR, format file, pengkodean karakter, dan metadata penting lainnya sehingga keturunannya dapat mengkonversi data kembali ke kode sumber.

Arsip ini juga akan menyertakan panduan umum Tech Tree jika pembaca di masa mendatang kehabisan komputer yang berfungsi dan harus membangun kembali teknologi dari awal.

Sumber: www.habr.com

Tambah komentar