GitHub on luonut tuhatvuotisen arkiston, jossa se säilyttää avoimen lähdekoodin arkistot jälkipolville

GitHub on luonut tuhatvuotisen arkiston, jossa se säilyttää avoimen lähdekoodin arkistot jälkipolville
Entinen hiilikaivos, johon tulee Arctic World Archive -varasto. Photo Shoot: Guy Martin / Bloomberg Businessweek

Ilmaiset ohjelmistot ovat modernin sivilisaation kulmakivi ja koko ihmiskunnan yhteinen perintö. Tehtävä GitHub-arkistoohjelmat - säilytä tämä koodi tuleville sukupolville, jotta Aleksandrian kirjaston historia ei koskaan toistu.

Tätä varten GitHub luo useita varmuuskopioita eri tietovälineille, mukaan lukien pitkäaikaista tallennusta Arctic Code Vault Huippuvuorilla. Se sijaitsee entisessä hiilikaivoksessa 250 metrin syvyydessä ikiroudassa, ja sen säilyvyys on vähintään 1000 vuotta.

Tilannekuva ihmiskunnan ohjelmistokoodista otetaan 2. helmikuuta 2020.

Pitkäaikainen tiedontallennusprojekti käynnistettiin yhdessä Long Now Foundationin, Internet Archiven, Software Heritage Foundationin, Arctic World Archiven ja muiden kumppaneiden kanssa.

Projekti LOCKSS

Nykyään tärkeä koodi voidaan unohtaa tai kadota ajan myötä. Pahinta on, että globaalin katastrofin sattuessa menetämme kaiken tiedon, joka oli tallennettu ”lyhennysvälineille”: kiintolevylle, SSD:lle, CD:lle ja DVD:lle, jotka on suunniteltu useiden vuosikymmenien ajaksi, nauhoille, joiden ehdollinen käyttöikä 30 vuotta vaatii lämpötilan ja kosteuden tiukka valvonta.

Ratkaisu ongelmaan on varmuuskopioiden monistus eli ohjelmistojen arkistointi useiden organisaatioiden toimesta ja eri muodoissa. Tämä projekti ns LOCKSS on vielä alkanut lähes 20 vuotta. Ohjelma esiteltiin toukokuussa 2019 LUKITUS 2.0-alpha - ensimmäinen ohjelmistoprototyyppi hajautettuun tiedontallennukseen pitkään aikaan, tukee useita osallistujia ja ulkoista tallennustilaa.

Järjestelmän suunnittelijat olettavat, että laitteisto voi olla paljon kestävämpää kuin lyhytkestoinen media: siksi "on olemassa useita mahdollisia tulevaisuuksia, joissa toimivia nykyaikaisia ​​tietokoneita on olemassa, mutta niiden ohjelmistot ovat suurelta osin kadonneet".

GitHub muistuttaa meitä monista kadonneista teknologioista, joista olisi voinut olla hyötyä: roomalainen betoni (hänen reseptinsä löydettiin uudelleen vasta vuonna 2014), malarialääke DFDT, kadonnut piirustuksia Saturn 5 -raketista. On helppo kuvitella tulevaisuutta, jossa nykyiset ohjelmistot nähdään viehättävinä, kauan unohdettuina tarpeettomana, kunnes sille ilmaantuu odottamaton tarve: "Kuten kaikki varmuuskopiot, myös GitHubin arkistointiohjelma on suunniteltu odottamatonta tulevaisuutta varten", sanoo ohjelman GitHub. verkkosivuston arkisto.

GitHub-arkisto

GitHub Archive tarjoaa kolme varmuuskopiotasoa:

  • kuuma: melkein reaaliaikainen
  • lämmin: päivitetään kuukauden ja vuoden välein
  • kylmä: päivitetään 5+ vuoden välein

Kaikkien GitHub-käyttäjien toimenpiteiden jälkeen kaikki Git-data kopioidaan useisiin palvelinkeskuksiin ympäri maailmaa. Git-varmuuskopiot, ongelmat, vetopyynnöt ja kaikki GitHubin käyttäjätiedot on tallennettu useisiin paikkoihin. Nämä tiedot ovat saatavilla reaaliajassa GitHub API:n kautta.

Lisäksi rekursiivisen indeksoinnin järjestää GHTorrent-indeksointirobotti, joka lataa arkistoja päivittäin tai kuukausittain. GH-arkiston kautta kuvia arkistosta voi saada BigQuery-kyselyillä. Muut koodin kopiot sijaitsevat Internet-arkiston tunnetussa Time Machinessa, joka tallentaa kopiot useisiin paikkoihin. Lopuksi Software Heritage Foundation indeksoi säännöllisesti GitHubin ja lisää julkiset tietovarastonsa arkistoonsa, jossa on julkinen API.

Arctic GitHub-arkisto

2. helmikuuta 2020 GitHub tekee kopion kaikista aktiivisista julkisista arkistoista ja sijoittaa ne GitHub Arctic -tietovarastoon.

Tiedot tallennetaan 3500 500 jalan filmikeloille, jonka toimittaa pitkäaikaiseen tiedontallennukseen erikoistunut norjalainen Piql. ISO-mittausten mukaan tämän hopeahalogenidipolyesterikalvon käyttöikä on XNUMX vuotta. Simuloidut ikääntymistestit ovat osoittaneet, että Piql-kalvo säilyttää tiedot vähintään kaksi kertaa kauemmin.

Lisäksi GitHub Archive tekee yhteistyötä Microsoft Silica -projektin tutkijoiden kanssa polttaakseen kaikki julkiset arkistot kvartsilasilevyille femtosekuntilaserin avulla. Tämä väline takaa tietojen turvallisuuden yli 10 000 vuodeksi.

Arctic GitHub -koodivarasto on luotu Arctic World Archiven (AWA) pohjalta 250 metrin syvyyteen ikiroudassa. Arkisto sijaitsee entisessä hiilikaivoksessa Spitsbergenin saaristossa, joka ei ole kovin kaukana pohjoisnavalta. Ilmaston lämpeneminen vaikuttaa vain muutamaan metriin ikiroutaa, eikä se uhkaa kaivosta lähitulevaisuudessa (useita tuhansia vuosia).

Svalbard on säännelty kansainvälinen sopimus kuin demilitarisoitu vyöhyke. GitHubin mukaan se on yksi maapallon syrjäisimmistä ja geopoliittisesti vakaimmista ihmisasutuspaikoista. Lähistöllä on kuuluisa World Seed Vault, ihmiskunnan tärkein toivo apokalypsin sattuessa.

GitHub on luonut tuhatvuotisen arkiston, jossa se säilyttää avoimen lähdekoodin arkistot jälkipolville
World Seed Vault Svalbardissa

AWA on norjalaisen valtion omistaman kaivosyhtiön Norske Spitsbergen Kulkompanin (SNSK) ja digitaalisen säilytyksen tarjoajan Piql AS:n yhteinen aloite. Siellä on jo tallennettu historiallisia ja kulttuurisia tietoja Italiasta, Brasiliasta, Norjasta, Vatikaanista ja muista maista.

GitHub on luonut tuhatvuotisen arkiston, jossa se säilyttää avoimen lähdekoodin arkistot jälkipolville
Photo Shoot: Guy Martin / Bloomberg Businessweek

GitHub-koodirullat säilytetään terässivuisessa säiliössä suljetussa kammiossa. Tilannekuva 02.02.2020 sisältää kaikki aktiiviset GitHub-arkistot ja merkittävän osan ei-aktiivisista (tähdistä, riippuvuuksista jne. päätellen), kaikki binaaritiedostot 100 kt:aan asti. Jokainen arkisto erillisessä tar-tiedostossa. Kaiken pitäisi mahtua 200 120 Gt:n kelalle.

Arkiston mukana tulee ihmisen luettava luettelo ja tekniset käsikirjat QR-dekoodauksesta, tiedostomuodoista, merkkikoodauksista ja muista tärkeistä metatiedoista, jotta jälkeläiset voivat muuntaa tiedot takaisin lähdekoodiksi.

Arkisto sisältää myös yleisen Tech Tree -oppaan siltä varalta, että tulevilta lukijoilta loppuvat toimivat tietokoneet ja heidän on rakennettava tekniikkaa uudelleen alusta.

Lähde: will.com

Lisää kommentti