GitHub сохранил архив открытого кода в арктическом хранилище
GitHub объявил о воплощении проекта по созданию архива открытых исходных текстов, размещённого в арктическом хранилище Arctic World Archive, способного уцелеть в случае наступления глобальной катастрофы. 186 плёночных накопителей piqlFilm, которые содержат фотоснимки информации и позволяют сохранять информацию более 1000 лет (по другим данным срок службы составляет 500 лет), успешно размещены в подземном хранилище на острове Шпицберген. Хранилище создано из заброшенной угольной шахты глубиной 150 метров, достаточной чтобы обеспечить сохранность информации даже в случае применения ядерного или электромагнитного оружия.
В архиве сохранено около 21 ТБ информации, представляющей код многих открытых проектов, размещённых на GitHub. Разработчики, код которых попал в архив, помечены в профиле на GitHub специальной меткой «Arctic Code Vault Contributor». На случай возникновения проблем с хранилищем «Arctic World Archive», рассматривается возможность создания дублирующих архивов длительного хранения.
Из планов Microsoft по развитию инициативы отмечается намерение создать более глобальный архив информации, охватывающей общий срез знаний, накопленных компьютерной индустрией, включая книги, документацию, информацию о разработке ПО, языках программирования, электронике, микропроцессорах и вычислительной технике, а также сведения об истории развития технологий и культурных аспектах. Целью инициативы является предоставление исчерпывающих сведений, которые могут помочь исследователям из будущего воссоздать нынешние технологии и лучше понять современный мир.
Параллельно развивается несколько альтернативных проектов по созданию архивов с кодом. В качестве эксперимента проектом Silica в накопителях длительного хранения на основе пластин из кварцевого стекла сохранено содержимое 6000 наиболее популярных репозиториев GitHub. Данные сохраняются путём физического изменения свойств материала, неподверженного воздействию электромагнитного излучения, воды и жары, что позволяет добиться времени сохранения на уровне десятков тысяч лет.
Проект «Internet Archive» сохранил в своём архиве срез публичных репозиториев с GitHub по состоянию на 13 апреля. Всего сохранено около 55 ТБ информации о репозиториях, включая комментарии, issue и прочие метаданные. В дальнейшем создатели Internet Archive намерены предоставить возможность извлечения кода проектов из архива, используя команду «git clone» (развивается аналог сервиса Wayback Machine для кода).
Организация Software Heritage Foundation, учреждённая национальным исследовательским институтом Франции (Inria) при поддержке ЮНЕСКО, поставила перед собой цель накопления и сохранения исходных текстов. В настоящее время архив Software Heritage уже насчитывает 130 млн проектов и включает полную историю их разработки. 100 млн из этих проектов импортированы из GitHub. Любой желающий может запросить архивирование своего кода на сайте save.softwareheritage.org, указав ссылку на репозиторий Git, Mercurial или Subversion. Имеется возможность поиска, навигации по коду и загрузки заархивированных проектов.