GitHub стварыў тысячагадовае сховішча, у якім захавае Open Source-рэпазітары для нашчадкаў

GitHub стварыў тысячагадовае сховішча, у якім захавае Open Source-рэпазітары для нашчадкаў
Былая вугальная шахта, у якой месцяцца сховішча Arctic World Archive. Фота: Guy Martin / Bloomberg Businessweek

Вольнае праграмнае забеспячэнне - краевугольны камень сучаснай цывілізацыі і агульная спадчына ўсяго чалавецтва. Місія праграмы GitHub Archive - захаваць гэты код для будучых пакаленняў, каб гісторыя Александрыйскай бібліятэкі ніколі не паўтарылася.

Для гэтага GitHub завядзе шмат рэзервовых копій на розных носьбітах, у тым ліку доўгатэрміновае сховішча Arctic Code Vault на Шпіцбергене. Яно размяшчаецца ў былой вугальнай шахце на глыбіні 250 метраў у вечнай мерзлаце і разлічана на тэрмін захоўвання мінімум 1000 гадоў.

Здымак праграмнага кода чалавецтва зробяць 2 лютага 2020 года..

Праект доўгачасовага захоўвання дадзеных запушчаны сумесна з Long Now Foundation, Інтэрнет-архівам, Фондам спадчыны праграмнага забеспячэння, Arctic World Archive і іншымі партнёрамі.

Праект LOCKSS

Жыццёва важны сёння код з часам можа быць забыты ці страчаны. Самае страшнае, калі ў выпадку глабальнай катастрофы мы страцім усю інфармацыю, якая захоўвалася на "эфемерных" носьбітах: HDD, SSD, CD і DVD, разлічаных на некалькі дзесяцігоддзяў, на стужках, у якіх умоўны тэрмін службы 30 гадоў мяркуе строгі кантроль тэмпературы і вільготнасці. .

Рашэнне праблемы - дублікацыя рэзервовых копій, гэта значыць архіваванне праграмнага забеспячэння некалькімі арганізацыямі і ў розных формах. Гэты праект пад назвай LOCKSS стартаваў яшчэ амаль 20 гадоў. У маі 2019 года была прадстаўлена праграма LOCKSS 2.0-alpha - Першы прататып ПЗ для размеркаванага захавання дадзеных на працяглы час з падтрымкай мноства ўдзельнікаў і знешніх сховішчаў.

Распрацоўнікі сістэмы зыходзяць з таго, што апаратныя сродкі могуць быць значна больш даўгавечнымі, чым эфемерныя носьбіты: таму "існуе цэлы шэраг магчымых варыянтаў будучыні, у якіх працоўныя сучасныя кампутары існуюць, але іх праграмнае забеспячэнне ў значнай ступені страчана".

GitHub нагадвае аб мностве страчаных тэхналогій, якія маглі быць карыснымі: рымскі бетон (яго рэцэпт быў зноўку адкрыты толькі ў 2014 годзе), супрацьмалярыйны прэпарат DFDT, страчаныя чарцяжы ракеты "Сатурн-5". Лёгка ўявіць сабе будучыню, у якой сённяшняе праграмнае забеспячэнне будзе разглядацца як мудрагелістая і даўно забытая непатрэбнасць, пакуль не ўзнікне нечаканае запатрабаванне ў ім: "Як і любая рэзервовая копія, архіўная праграма GitHub таксама прызначаная для непрадбачанай будучыні", – гаворыцца на сайце праграмы GitHub Archive.

GitHub Archive

GitHub Archive прадугледжвае тры ўзроўні рэзервовых копій:

  • гарачы: амаль у рэальным часе
  • цёплы: абнаўляецца ў прамежках ад месяца да года
  • халодны: абнаўляецца кожныя 5+ гадоў

Пасля любых дзеянняў карыстачоў GitHub усе дадзеныя Git рэплікуюцца ў некалькі дата-цэнтраў па ўсім свеце. У некалькіх месцах захоўваюцца бэкапы Git, issue, пул-рэквесты і ўсе карыстацкія дадзеныя на GitHub. Гэтая інфармацыя даступная ў рэальным часе праз GitHub API.

Акрамя таго, арганізаваны рэкурсіўнае індэксаванне краулерам GHTorrent, які будзе выкладваць архівы на штодзённай ці штомесячнай аснове. Праз GH Archive здымкі з архіву можна атрымаць запытамі BigQuery. Іншыя копіі кода размяшчаюцца ў добра вядомай "Машыне часу" для Інтэрнэт-архіва, якая захоўвае копіі ў некалькіх месцах. Нарэшце, Фонд спадчыны праграмнага забеспячэння (Software Heritage Foundation) будзе рэгулярна сканаваць GitHub і дадаваць свае публічныя рэпазітары ў свой архіў, для якога ёсць публічны API.

Арктычнае сховішча GitHub

2 лютага 2020 года GitHub зробіць копію ўсіх актыўных публічных рэпазітараў - і змесціць іх у Арктычнае сховішча GitHub.

Дадзеныя будуць захоўвацца на 3500-футавыя плёначных шпульках, прадстаўленых нарвежскай кампаніяй Piql, якая спецыялізуецца на працяглым захоўванні дадзеных. Паводле вымярэнняў ISO, гэтая плёнка з галагенідамі срэбра ў поліэфіры мае тэрмін жыцця 500 гадоў. Тэсты імітацыйнага старэння паказалі, што плёнка Piql захоўвае інфармацыю прынамсі ўдвая даўжэй.

Акрамя таго, GitHub Archive супрацоўнічае з даследчыкі праекта Microsoft Silica, каб запісаць усе публічныя рэпазітары на кварцавыя шкляныя пласціны з дапамогай фемтасекунднага лазера. Гэты носьбіт забяспечыць захаванасць дадзеных больш за 10 000 гадоў.

Арктычнае сховішча кода GitHub ствараецца на базе Arctic World Archive (AWA) на глыбіні 250 метраў у вечнай мерзлаце. Архіў знаходзіцца ў былой вугальнай шахце на архіпелагу Шпіцберген, што не вельмі далёка ад Паўночнага полюса. Глабальнае пацяпленне закране ўсяго некалькі метраў вечнай мерзлаты і не пагражае шахце ў бліжэйшы час (некалькі тысяч гадоў).

Шпіцберген рэгулюецца міжнароднай дамовай як дэмілітарызаваная зона. Гэта адно з самых аддаленых і геапалітычна стабільных чалавечых селішчаў на Зямлі, лічыць GitHub. Там жа непадалёк размяшчаецца знакамітае Сусветнае насеннесховішча, галоўная надзея чалавецтва на выпадак апакаліпсісу.

GitHub стварыў тысячагадовае сховішча, у якім захавае Open Source-рэпазітары для нашчадкаў
Сусветнае насеннесховішча на Шпіцбергене

AWA – сумесная ініцыятыва паміж нарвежскай дзяржаўнай горназдабыўной кампаніяй Norske Spitsbergen Kulkompani (SNSK) і правайдэрам лічбавага захавання Piql AS. Тамака ўжо захоўваюцца гістарычныя і культурныя дадзеныя з Італіі, Бразіліі, Нарвегіі, Ватыкана і іншых краін.

GitHub стварыў тысячагадовае сховішча, у якім захавае Open Source-рэпазітары для нашчадкаў
Фота: Guy Martin / Bloomberg Businessweek

Шпулькі з кодам GitHub будуць захоўвацца ў кантэйнеры са сталёвымі сценкамі ўсярэдзіне герметычнай камеры. У здымак 02.02.2020 гады патрапяць усе актыўныя рэпазітары GitHub і значная частка неактыўных (мяркуючы па зорках, залежнасцях і інш.), усе бінарныя файлы да 100 КБ. Кожны рэпазітар у асобным файле tar. Усё павінна змясціцца на 200 шпулек па 120 ГБ.

Разам з архівам пакладуць чалавекачытальны каталог і тэхнічныя кіраўніцтвы па дэкадаванні QR, фарматам файлам, кадоўкам знакаў і іншыя важным метададзеным, каб нашчадкі пераўтварыць дадзеныя зваротна ў зыходны код.

У архіў таксама ўключаць агульнае кіраўніцтва Tech Tree на той выпадак, калі ў будучых чытачоў не застанецца працавальных кампутараў і ім давядзецца аднаўляць тэхналогіі з нуля.

Крыніца: habr.com

Купіць надзейны хостынг для сайтаў з абаронай ад DDoS, VPS VDS серверы 🔥 Купіць надзейны хостынг для сайтаў з абаронай ад DDoS, VPS VDS серверы | ProHoster