GitHub vytvoril tisícročné úložisko, v ktorom bude uchovávať úložiská s otvoreným zdrojom pre budúce generácie

GitHub vytvoril tisícročné úložisko, v ktorom bude uchovávať úložiská s otvoreným zdrojom pre budúce generácie
Bývalá uhoľná baňa, v ktorej bude sklad Arctic World Archive. fotografie: Guy Martin/Bloomberg Businessweek

Slobodný softvér je základným kameňom modernej civilizácie a spoločným dedičstvom celého ľudstva. Misia Programy GitHub Archive - zachovať tento kód pre budúce generácie, aby sa história Alexandrijskej knižnice už nikdy nezopakovala.

Za týmto účelom GitHub vytvorí veľa záložných kópií na rôznych médiách vrátane dlhodobého úložiska Vault Arctic Code na Špicbergoch. Nachádza sa v bývalej uhoľnej bani v hĺbke 250 metrov v permafroste a je dimenzovaná na skladovateľnosť minimálne 1000 rokov.

Snímka softvérového kódu ľudstva bude urobená 2. februára 2020.

Projekt dlhodobého ukladania údajov bol spustený v spolupráci s Long Now Foundation, Internet Archive, Software Heritage Foundation, Arctic World Archive a ďalšími partnermi.

Projekt LOCKSS

Kód, ktorý je dnes životne dôležitý, môže byť časom zabudnutý alebo stratený. Najhoršie je, že v prípade globálnej katastrofy prídeme o všetky informácie, ktoré boli uložené na „efemérnych“ médiách: HDD, SSD, CD a DVD, navrhnuté na niekoľko desaťročí, na páskach, ktorých podmienečná životnosť 30 rokov vyžaduje. prísna kontrola teploty a vlhkosti.

Riešením problému je duplikácia záložných kópií, teda archivácia softvéru viacerými organizáciami a v rôznych formách. Tento projekt tzv LOCKSS ešte začala takmer 20 rokov. Program bol predstavený v máji 2019 LOCKSS 2.0-alfa - prvý prototyp softvéru pre distribuované ukladanie dát na dlhú dobu s podporou viacerých účastníkov a externým úložiskom.

Dizajnéri systému predpokladajú, že hardvér môže byť oveľa odolnejší ako efemérne médiá: preto „existuje množstvo možných budúcnosti, v ktorých fungujú moderné počítače, ale ich softvér je do značnej miery stratený.“

GitHub nám pripomína mnoho stratených technológií, ktoré mohli byť užitočné: rímsky betón (jeho recept bol znovuobjavený až v roku 2014), antimalarikum DFDT, stratený výkresy rakety Saturn 5. Je ľahké si predstaviť budúcnosť, v ktorej sa dnešný softvér považuje za svojrázny, dávno zabudnutý nepodstatný prvok, až kým sa neobjaví neočakávaná potreba: „Ako každá záloha, aj archívny program GitHubu je navrhnutý pre nepredvídanú budúcnosť,“ hovorí GitHub programu. Archív webovej stránky.

Archív GitHub

Archív GitHub poskytuje tri úrovne zálohovania:

  • horúco: takmer v reálnom čase
  • teplý: aktualizované v intervaloch od mesiaca do roka
  • prechladnutie: aktualizované každých 5+ rokov

Po akejkoľvek akcii používateľov GitHubu sa všetky údaje Git replikujú do viacerých dátových centier po celom svete. Zálohy Git, problémy, požiadavky na stiahnutie a všetky používateľské údaje na GitHub sú uložené na niekoľkých miestach. Tieto informácie sú dostupné v reálnom čase prostredníctvom GitHub API.

Okrem toho rekurzívne indexovanie organizuje prehľadávač GHTorren, ktorý bude nahrávať archívy na dennej alebo mesačnej báze. Prostredníctvom GH Archive je možné získať obrázky z archívu pomocou dopytov BigQuery. Ďalšie kópie kódu sú uložené v známom Time Machine Internet Archive, ktorý ukladá kópie na viacerých miestach. Napokon, Software Heritage Foundation bude pravidelne prehľadávať GitHub a pridávať svoje verejné úložiská do svojho archívu, ktorý má verejné API.

Arktické úložisko GitHub

2. februára 2020 GitHub vytvorí kópiu všetkých aktívnych verejných úložísk a umiestni ich do arktického úložiska GitHub.

Dáta budú uložené na 3500-stopových filmových kotúčoch, ktoré poskytne nórska spoločnosť Piql, ktorá sa špecializuje na dlhodobé ukladanie dát. Podľa meraní ISO má táto polyesterová fólia z halogenidu striebra životnosť 500 rokov. Simulované testy starnutia ukázali, že Piql film uchováva informácie minimálne dvakrát dlhšie.

Archív GitHub navyše spolupracuje s výskumníkmi projektu Microsoft Silica na napálení všetkých verejných úložísk na doštičky z kremenného skla pomocou femtosekundového lasera. Toto médium zaistí bezpečnosť údajov na viac ako 10 000 rokov.

Arktické úložisko kódu GitHub je vytvorené na základe archívu Arctic World Archive (AWA) v hĺbke 250 metrov v permafroste. Archív sa nachádza v bývalej uhoľnej bani na súostroví Špicbergy, ktoré nie je veľmi ďaleko od severného pólu. Globálne otepľovanie ovplyvní len niekoľko metrov permafrostu a bane v blízkej budúcnosti (niekoľko tisíc rokov) neohrozí.

Svalbard je regulovaný medzinárodná zmluva ako demilitarizovaná zóna. Ide o jedno z najvzdialenejších a geopoliticky najstabilnejších ľudských sídiel na Zemi, uvádza GitHub. Neďaleko je slávny World Seed Vault, hlavná nádej ľudstva v prípade apokalypsy.

GitHub vytvoril tisícročné úložisko, v ktorom bude uchovávať úložiská s otvoreným zdrojom pre budúce generácie
Global Seed Vault na Svalbarde

AWA je spoločná iniciatíva medzi nórskou štátnou ťažobnou spoločnosťou Norske Spitsbergen Kulkompani (SNSK) a poskytovateľom digitálneho uchovávania Piql AS. Už tam sú uložené historické a kultúrne údaje z Talianska, Brazílie, Nórska, Vatikánu a ďalších krajín.

GitHub vytvoril tisícročné úložisko, v ktorom bude uchovávať úložiská s otvoreným zdrojom pre budúce generácie
fotografie: Guy Martin/Bloomberg Businessweek

Kotúče kódu GitHub budú uložené v kontajneri s oceľovými stenami v uzavretej komore. Snímka z 02.02.2020 bude zahŕňať všetky aktívne úložiská GitHub a značnú časť neaktívnych (súdiac podľa hviezdičiek, závislostí atď.), všetky binárne súbory do 100 KB. Každé úložisko v samostatnom súbore tar. Všetko by sa malo zmestiť na 200 120 GB cievok.

Spolu s archívom bude aj ľudsky čitateľný katalóg a technické príručky o QR dekódovaní, formátoch súborov, kódovaní znakov a iných dôležitých metadátach, aby potomkovia mohli dáta previesť späť do zdrojového kódu.

Archív bude obsahovať aj všeobecnú príručku Tech Tree pre prípad, že budúcim čitateľom dôjdu funkčné počítače a budú musieť prestavať technológiu od začiatku.

Zdroj: hab.com

Pridať komentár