อดีตเหมืองถ่านหินที่จะเป็นที่ตั้งของศูนย์จัดเก็บ Arctic World Archive
ซอฟต์แวร์ฟรีเป็นรากฐานสำคัญของอารยธรรมสมัยใหม่และเป็นมรดกร่วมกันของมวลมนุษยชาติ ภารกิจ
ในการดำเนินการนี้ GitHub จะสร้างสำเนาสำรองจำนวนมากบนสื่อต่างๆ รวมถึงการจัดเก็บข้อมูลระยะยาว
จะมีการจับภาพโค้ดซอฟต์แวร์ของมนุษยชาติในวันที่ 2 กุมภาพันธ์ 2020.
โครงการจัดเก็บข้อมูลระยะยาวนี้เปิดตัวร่วมกับ Long Now Foundation, Internet Archive, Software Heritage Foundation, Arctic World Archive และพันธมิตรอื่นๆ
โครงการ LOCKSS
รหัสที่มีความสำคัญในปัจจุบันอาจถูกลืมหรือสูญหายไปตามกาลเวลา สิ่งที่แย่ที่สุดคือในกรณีที่เกิดภัยพิบัติทั่วโลก เราจะสูญเสียข้อมูลทั้งหมดที่จัดเก็บไว้ในสื่อ "ชั่วคราว": HDD, SSD, ซีดีและดีวีดีที่ออกแบบมาเป็นเวลาหลายทศวรรษบนเทปที่ต้องมีอายุการใช้งานแบบมีเงื่อนไข 30 ปี การควบคุมอุณหภูมิและความชื้นอย่างเข้มงวด
วิธีแก้ปัญหาคือการทำซ้ำสำเนาสำรอง นั่นคือ การเก็บถาวรซอฟต์แวร์โดยหลายองค์กรและในรูปแบบที่แตกต่างกัน โครงการนี้มีชื่อว่า
ผู้ออกแบบระบบสันนิษฐานว่าฮาร์ดแวร์สามารถทนทานกว่าสื่อชั่วคราวได้มาก ดังนั้น "มีอนาคตที่เป็นไปได้หลายประการที่คอมพิวเตอร์สมัยใหม่ใช้งานได้ แต่ซอฟต์แวร์ของพวกเขาสูญหายไปเป็นส่วนใหญ่"
GitHub เตือนเราถึงเทคโนโลยีที่สูญหายไปมากมายซึ่งอาจมีประโยชน์:
เอกสารเก่า GitHub
GitHub Archive มีการสำรองข้อมูลสามระดับ:
- ร้อน: เกือบจะเรียลไทม์
- อบอุ่น: อัปเดตเป็นระยะตั้งแต่เดือนถึงหนึ่งปี
- เย็น: อัปเดตทุก 5 ปีขึ้นไป
หลังจากผู้ใช้ GitHub ดำเนินการใดๆ ข้อมูล Git ทั้งหมดจะถูกจำลองไปยังศูนย์ข้อมูลหลายแห่งทั่วโลก การสำรองข้อมูล Git ปัญหา คำขอดึงข้อมูล และข้อมูลผู้ใช้ทั้งหมดบน GitHub จะถูกจัดเก็บไว้ในหลายแห่ง ข้อมูลนี้พร้อมใช้งานแบบเรียลไทม์ผ่าน GitHub API
นอกจากนี้ การจัดทำดัชนีแบบเรียกซ้ำยังจัดระเบียบโดยโปรแกรมรวบรวมข้อมูล GHTorrent ซึ่งจะอัปโหลดไฟล์เก็บถาวรเป็นรายวันหรือรายเดือน ผ่าน GH Archive สามารถรับรูปภาพจากไฟล์เก็บถาวรได้โดยใช้คำค้นหา BigQuery สำเนาโค้ดอื่น ๆ อยู่ใน Time Machine ที่รู้จักกันดีของ Internet Archive ซึ่งเก็บสำเนาไว้ในหลาย ๆ ที่ สุดท้ายนี้ Software Heritage Foundation จะรวบรวมข้อมูล GitHub เป็นประจำและเพิ่มพื้นที่เก็บข้อมูลสาธารณะไปยังไฟล์เก็บถาวรซึ่งมี API สาธารณะ
พื้นที่เก็บข้อมูล Arctic GitHub
ในวันที่ 2 กุมภาพันธ์ 2020 GitHub จะสร้างสำเนาของพื้นที่เก็บข้อมูลสาธารณะที่ใช้งานอยู่ทั้งหมด และวางไว้ในพื้นที่เก็บข้อมูล GitHub Arctic
ข้อมูลจะถูกจัดเก็บไว้ในม้วนฟิล์มขนาด 3500 ฟุตที่จัดทำโดย Piql ซึ่งเป็นบริษัทนอร์เวย์ที่เชี่ยวชาญด้านการจัดเก็บข้อมูลระยะยาว ตามการวัดของ ISO ฟิล์มโพลีเอสเตอร์ซิลเวอร์เฮไลด์นี้มีอายุการใช้งาน 500 ปี การทดสอบอายุจำลองแสดงให้เห็นว่าฟิล์ม Piql คงข้อมูลไว้ได้นานกว่าอย่างน้อยสองเท่า
นอกจากนี้ GitHub Archive ยังร่วมมือกับนักวิจัยโครงการ Microsoft Silica เพื่อเบิร์นที่เก็บข้อมูลสาธารณะทั้งหมดลงบนเวเฟอร์แก้วควอตซ์โดยใช้เลเซอร์เฟมโตวินาที สื่อนี้จะรับประกันความปลอดภัยของข้อมูลมานานกว่า 10 ปี
ที่เก็บโค้ด Arctic GitHub ถูกสร้างขึ้นบนพื้นฐานของ Arctic World Archive (AWA) ที่ระดับความลึก 250 เมตรในชั้นดินเยือกแข็งถาวร หอจดหมายเหตุตั้งอยู่ในอดีตเหมืองถ่านหินบนหมู่เกาะ Spitsbergen ซึ่งอยู่ไม่ไกลจากขั้วโลกเหนือมากนัก ภาวะโลกร้อนจะส่งผลกระทบต่อชั้นดินเยือกแข็งถาวรเพียงไม่กี่เมตร และจะไม่คุกคามเหมืองในอนาคตอันใกล้นี้ (หลายพันปี)
สฟาลบาร์ได้รับการควบคุม
Global Seed Vault ในสฟาลบาร์
AWA เป็นความคิดริเริ่มร่วมกันระหว่างบริษัทเหมืองแร่ Norske Spitsbergen Kulkompani (SNSK) ที่รัฐเป็นเจ้าของของนอร์เวย์ และ Piql AS ผู้ให้บริการอนุรักษ์ดิจิทัล ข้อมูลทางประวัติศาสตร์และวัฒนธรรมจากอิตาลี บราซิล นอร์เวย์ วาติกัน และประเทศอื่นๆ ได้ถูกเก็บไว้ที่นั่นแล้ว
วงล้อรหัส GitHub จะถูกจัดเก็บไว้ในภาชนะด้านเหล็กภายในห้องที่ปิดสนิท สแน็ปช็อตของวันที่ 02.02.2020 จะรวมพื้นที่เก็บข้อมูล GitHub ที่ใช้งานอยู่ทั้งหมดและส่วนสำคัญของพื้นที่เก็บข้อมูลที่ไม่ได้ใช้งาน (ตัดสินโดยดาว การขึ้นต่อกัน ฯลฯ) ไฟล์ไบนารีทั้งหมดมีขนาดสูงสุด 100 KB แต่ละที่เก็บในไฟล์ tar แยกกัน ทุกอย่างควรพอดีกับสปูล 200 120 GB
นอกจากไฟล์เก็บถาวรแล้วยังมีแค็ตตาล็อกและคู่มือทางเทคนิคที่มนุษย์สามารถอ่านได้เกี่ยวกับการถอดรหัส QR รูปแบบไฟล์ การเข้ารหัสอักขระ และข้อมูลเมตาที่สำคัญอื่น ๆ เพื่อให้ผู้สืบทอดสามารถแปลงข้อมูลกลับไปเป็นซอร์สโค้ดได้
ไฟล์เก็บถาวรจะรวมคู่มือ Tech Tree ทั่วไปไว้ด้วย ในกรณีที่ผู้อ่านในอนาคตไม่มีคอมพิวเตอร์ที่ใช้งานได้ และต้องสร้างเทคโนโลยีใหม่ตั้งแต่ต้น
ที่มา: will.com