Bývalá uhoľná baňa, v ktorej bude sklad Arctic World Archive.
Slobodný softvér je základným kameňom modernej civilizácie a spoločným dedičstvom celého ľudstva. Misia
Za týmto účelom GitHub vytvorí veľa záložných kópií na rôznych médiách vrátane dlhodobého úložiska
Snímka softvérového kódu ľudstva bude urobená 2. februára 2020.
Projekt dlhodobého ukladania údajov bol spustený v spolupráci s Long Now Foundation, Internet Archive, Software Heritage Foundation, Arctic World Archive a ďalšími partnermi.
Projekt LOCKSS
Kód, ktorý je dnes životne dôležitý, môže byť časom zabudnutý alebo stratený. Najhoršie je, že v prípade globálnej katastrofy prídeme o všetky informácie, ktoré boli uložené na „efemérnych“ médiách: HDD, SSD, CD a DVD, navrhnuté na niekoľko desaťročí, na páskach, ktorých podmienečná životnosť 30 rokov vyžaduje. prísna kontrola teploty a vlhkosti.
Riešením problému je duplikácia záložných kópií, teda archivácia softvéru viacerými organizáciami a v rôznych formách. Tento projekt tzv
Dizajnéri systému predpokladajú, že hardvér môže byť oveľa odolnejší ako efemérne médiá: preto „existuje množstvo možných budúcnosti, v ktorých fungujú moderné počítače, ale ich softvér je do značnej miery stratený.“
GitHub nám pripomína mnoho stratených technológií, ktoré mohli byť užitočné:
Archív GitHub
Archív GitHub poskytuje tri úrovne zálohovania:
- horúco: takmer v reálnom čase
- teplý: aktualizované v intervaloch od mesiaca do roka
- prechladnutie: aktualizované každých 5+ rokov
Po akejkoľvek akcii používateľov GitHubu sa všetky údaje Git replikujú do viacerých dátových centier po celom svete. Zálohy Git, problémy, požiadavky na stiahnutie a všetky používateľské údaje na GitHub sú uložené na niekoľkých miestach. Tieto informácie sú dostupné v reálnom čase prostredníctvom GitHub API.
Okrem toho rekurzívne indexovanie organizuje prehľadávač GHTorren, ktorý bude nahrávať archívy na dennej alebo mesačnej báze. Prostredníctvom GH Archive je možné získať obrázky z archívu pomocou dopytov BigQuery. Ďalšie kópie kódu sú uložené v známom Time Machine Internet Archive, ktorý ukladá kópie na viacerých miestach. Napokon, Software Heritage Foundation bude pravidelne prehľadávať GitHub a pridávať svoje verejné úložiská do svojho archívu, ktorý má verejné API.
Arktické úložisko GitHub
2. februára 2020 GitHub vytvorí kópiu všetkých aktívnych verejných úložísk a umiestni ich do arktického úložiska GitHub.
Dáta budú uložené na 3500-stopových filmových kotúčoch, ktoré poskytne nórska spoločnosť Piql, ktorá sa špecializuje na dlhodobé ukladanie dát. Podľa meraní ISO má táto polyesterová fólia z halogenidu striebra životnosť 500 rokov. Simulované testy starnutia ukázali, že Piql film uchováva informácie minimálne dvakrát dlhšie.
Archív GitHub navyše spolupracuje s výskumníkmi projektu Microsoft Silica na napálení všetkých verejných úložísk na doštičky z kremenného skla pomocou femtosekundového lasera. Toto médium zaistí bezpečnosť údajov na viac ako 10 000 rokov.
Arktické úložisko kódu GitHub je vytvorené na základe archívu Arctic World Archive (AWA) v hĺbke 250 metrov v permafroste. Archív sa nachádza v bývalej uhoľnej bani na súostroví Špicbergy, ktoré nie je veľmi ďaleko od severného pólu. Globálne otepľovanie ovplyvní len niekoľko metrov permafrostu a bane v blízkej budúcnosti (niekoľko tisíc rokov) neohrozí.
Svalbard je regulovaný
Global Seed Vault na Svalbarde
AWA je spoločná iniciatíva medzi nórskou štátnou ťažobnou spoločnosťou Norske Spitsbergen Kulkompani (SNSK) a poskytovateľom digitálneho uchovávania Piql AS. Už tam sú uložené historické a kultúrne údaje z Talianska, Brazílie, Nórska, Vatikánu a ďalších krajín.
Kotúče kódu GitHub budú uložené v kontajneri s oceľovými stenami v uzavretej komore. Snímka z 02.02.2020 bude zahŕňať všetky aktívne úložiská GitHub a značnú časť neaktívnych (súdiac podľa hviezdičiek, závislostí atď.), všetky binárne súbory do 100 KB. Každé úložisko v samostatnom súbore tar. Všetko by sa malo zmestiť na 200 120 GB cievok.
Spolu s archívom bude aj ľudsky čitateľný katalóg a technické príručky o QR dekódovaní, formátoch súborov, kódovaní znakov a iných dôležitých metadátach, aby potomkovia mohli dáta previesť späť do zdrojového kódu.
Archív bude obsahovať aj všeobecnú príručku Tech Tree pre prípad, že budúcim čitateľom dôjdu funkčné počítače a budú musieť prestavať technológiu od začiatku.
Zdroj: hab.com