Bekas tambang batu bara yang akan menampung fasilitas penyimpanan Arsip Dunia Arktik.
Perangkat lunak bebas adalah landasan peradaban modern dan warisan bersama seluruh umat manusia. Misi
Untuk melakukan ini, GitHub akan membuat banyak salinan cadangan di berbagai media, termasuk penyimpanan jangka panjang
Cuplikan kode perangkat lunak umat manusia akan diambil pada tanggal 2 Februari 2020.
Proyek penyimpanan data jangka panjang diluncurkan bersama dengan Long Now Foundation, Internet Archive, Software Heritage Foundation, Arctic World Archive dan mitra lainnya.
KUNCI Proyek
Kode yang penting saat ini bisa saja terlupakan atau hilang seiring berjalannya waktu. Hal terburuknya adalah jika terjadi bencana global kita akan kehilangan semua informasi yang disimpan di media βsementaraβ: HDD, SSD, CD dan DVD, yang dirancang selama beberapa dekade, pada kaset yang masa pakainya memerlukan waktu 30 tahun. kontrol ketat terhadap suhu dan kelembaban.
Solusi dari masalah ini adalah duplikasi backup, yaitu pengarsipan perangkat lunak oleh banyak organisasi dan dalam bentuk yang berbeda. Proyek ini disebut
Perancang sistem ini berasumsi bahwa perangkat keras bisa jauh lebih tahan lama dibandingkan media yang tidak bertahan lama: oleh karena itu, "ada sejumlah kemungkinan masa depan di mana komputer modern masih dapat berfungsi, namun sebagian besar perangkat lunaknya telah hilang."
GitHub mengingatkan kita akan banyak teknologi hilang yang sebenarnya bisa berguna:
Arsip GitHub
Arsip GitHub menyediakan tiga tingkat pencadangan:
- Panas: hampir waktu nyata
- Hangat: diperbarui dengan interval dari satu bulan hingga satu tahun
- Dingin: diperbarui setiap 5+ tahun
Setelah tindakan apa pun yang dilakukan pengguna GitHub, semua data Git direplikasi ke beberapa pusat data di seluruh dunia. Cadangan Git, masalah, permintaan penarikan, dan semua data pengguna di GitHub disimpan di beberapa tempat. Informasi ini tersedia secara real time melalui GitHub API.
Selain itu, pengindeksan rekursif diatur oleh crawler GHTorrent, yang akan mengunggah arsip setiap hari atau bulanan. Melalui GH Archive, gambar dari arsip dapat diperoleh menggunakan kueri BigQuery. Salinan kode lainnya disimpan di Time Machine Internet Archive yang terkenal, yang menyimpan salinan di banyak lokasi. Terakhir, Software Heritage Foundation akan secara rutin meng-crawl GitHub dan menambahkan repositori publiknya ke arsipnya, yang memiliki API publik.
Repositori GitHub Arktik
Pada tanggal 2 Februari 2020, GitHub akan membuat salinan semua repositori publik yang aktif dan menempatkannya di repositori GitHub Arctic.
Data tersebut akan disimpan pada gulungan film sepanjang 3500 kaki yang disediakan oleh Piql, sebuah perusahaan Norwegia yang berspesialisasi dalam penyimpanan data jangka panjang. Menurut pengukuran ISO, film poliester perak halida ini memiliki umur 500 tahun. Uji simulasi penuaan menunjukkan bahwa film Piql menyimpan informasi setidaknya dua kali lebih lama.
Selain itu, Arsip GitHub berkolaborasi dengan peneliti proyek Microsoft Silica untuk membakar semua repositori publik ke wafer kaca kuarsa menggunakan laser femtosecond. Media ini akan menjamin keamanan data selama lebih dari 10 tahun.
Repositori kode GitHub Arktik dibuat berdasarkan Arsip Dunia Arktik (AWA) pada kedalaman 250 meter di lapisan es. Arsip tersebut terletak di bekas tambang batu bara di kepulauan Spitsbergen, yang tidak jauh dari Kutub Utara. Pemanasan global hanya akan mempengaruhi beberapa meter lapisan es dan tidak mengancam tambang dalam waktu dekat (beberapa ribu tahun).
Svalbard diatur
Gudang Benih Dunia di Svalbard
AWA adalah inisiatif bersama antara perusahaan pertambangan milik negara Norwegia Norske Spitsbergen Kulkompani (SNSK) dan penyedia pelestarian digital Piql AS. Data sejarah dan budaya dari Italia, Brazil, Norwegia, Vatikan dan negara-negara lain sudah tersimpan di sana.
Gulungan kode GitHub akan disimpan dalam wadah bersisi baja di dalam ruang tertutup. Cuplikan 02.02.2020 akan mencakup semua repositori GitHub yang aktif dan sebagian besar repositori yang tidak aktif (dilihat dari bintang, dependensi, dll.), semua file biner hingga 100 KB. Setiap repositori dalam file tar terpisah. Semuanya harus muat pada 200 gulungan 120GB.
Bersamaan dengan arsip tersebut akan terdapat katalog yang dapat dibaca manusia dan manual teknis tentang decoding QR, format file, pengkodean karakter, dan metadata penting lainnya sehingga keturunannya dapat mengkonversi data kembali ke kode sumber.
Arsip ini juga akan menyertakan panduan umum Tech Tree jika pembaca di masa mendatang kehabisan komputer yang berfungsi dan harus membangun kembali teknologi dari awal.
Sumber: www.habr.com