GitHub ได้สร้างพื้นที่เก็บข้อมูลนับพันปีซึ่งจะเก็บรักษาพื้นที่เก็บข้อมูลโอเพ่นซอร์สไว้สำหรับลูกหลาน

GitHub ได้สร้างพื้นที่เก็บข้อมูลนับพันปีซึ่งจะเก็บรักษาพื้นที่เก็บข้อมูลโอเพ่นซอร์สไว้สำหรับลูกหลาน
อดีตเหมืองถ่านหินที่จะเป็นที่ตั้งของศูนย์จัดเก็บ Arctic World Archive Фото: กาย มาร์ติน/Bloomberg Businessweek

ซอฟต์แวร์ฟรีเป็นรากฐานสำคัญของอารยธรรมสมัยใหม่และเป็นมรดกร่วมกันของมวลมนุษยชาติ ภารกิจ โปรแกรมเก็บถาวร GitHub - เก็บรักษารหัสนี้ไว้สำหรับคนรุ่นต่อ ๆ ไป เพื่อว่าประวัติศาสตร์ของห้องสมุดอเล็กซานเดรียจะไม่ถูกทำซ้ำ

ในการดำเนินการนี้ GitHub จะสร้างสำเนาสำรองจำนวนมากบนสื่อต่างๆ รวมถึงการจัดเก็บข้อมูลระยะยาว ห้องนิรภัยรหัสอาร์กติก บนสปิตสเบอร์เกน ตั้งอยู่ในเหมืองถ่านหินเก่าที่ระดับความลึก 250 เมตรในชั้นดินเยือกแข็งถาวร และได้รับการออกแบบให้มีอายุการเก็บรักษาอย่างน้อย 1000 ปี

จะมีการจับภาพโค้ดซอฟต์แวร์ของมนุษยชาติในวันที่ 2 กุมภาพันธ์ 2020.

โครงการจัดเก็บข้อมูลระยะยาวนี้เปิดตัวร่วมกับ Long Now Foundation, Internet Archive, Software Heritage Foundation, Arctic World Archive และพันธมิตรอื่นๆ

โครงการ LOCKSS

รหัสที่มีความสำคัญในปัจจุบันอาจถูกลืมหรือสูญหายไปตามกาลเวลา สิ่งที่แย่ที่สุดคือในกรณีที่เกิดภัยพิบัติทั่วโลก เราจะสูญเสียข้อมูลทั้งหมดที่จัดเก็บไว้ในสื่อ "ชั่วคราว": HDD, SSD, ซีดีและดีวีดีที่ออกแบบมาเป็นเวลาหลายทศวรรษบนเทปที่ต้องมีอายุการใช้งานแบบมีเงื่อนไข 30 ปี การควบคุมอุณหภูมิและความชื้นอย่างเข้มงวด

วิธีแก้ปัญหาคือการทำซ้ำสำเนาสำรอง นั่นคือ การเก็บถาวรซอฟต์แวร์โดยหลายองค์กรและในรูปแบบที่แตกต่างกัน โครงการนี้มีชื่อว่า LOCKSS ได้เริ่มต้นแล้ว เกือบ 20 ปี- โปรแกรมนี้นำเสนอในเดือนพฤษภาคม 2019 ล็อคเอสเอส 2.0-อัลฟ่า - ซอฟต์แวร์ต้นแบบตัวแรกสำหรับการจัดเก็บข้อมูลแบบกระจายมาเป็นเวลานานโดยรองรับผู้เข้าร่วมหลายคนและการจัดเก็บข้อมูลภายนอก

ผู้ออกแบบระบบสันนิษฐานว่าฮาร์ดแวร์สามารถทนทานกว่าสื่อชั่วคราวได้มาก ดังนั้น "มีอนาคตที่เป็นไปได้หลายประการที่คอมพิวเตอร์สมัยใหม่ใช้งานได้ แต่ซอฟต์แวร์ของพวกเขาสูญหายไปเป็นส่วนใหญ่"

GitHub เตือนเราถึงเทคโนโลยีที่สูญหายไปมากมายซึ่งอาจมีประโยชน์: คอนกรีตโรมัน (สูตรของเขาถูกค้นพบใหม่ในปี 2014 เท่านั้น) ยาต้านมาเลเรีย DFDT, สูญหาย ภาพวาดจรวดแซทเทิร์น 5- เป็นเรื่องง่ายที่จะจินตนาการถึงอนาคตที่ซอฟต์แวร์ในปัจจุบันถูกมองว่าเป็นสิ่งที่แปลกตาและถูกลืมเลือนไปนาน จนกระทั่งมีความจำเป็นที่ไม่คาดคิดเกิดขึ้น: "เช่นเดียวกับการสำรองข้อมูล โปรแกรมเก็บถาวรของ GitHub ยังได้รับการออกแบบมาเพื่ออนาคตที่ไม่คาดฝัน" GitHub ของโปรแกรมกล่าว เอกสารเก่าของเว็บไซต์

เอกสารเก่า GitHub

GitHub Archive มีการสำรองข้อมูลสามระดับ:

  • ร้อน: เกือบจะเรียลไทม์
  • อบอุ่น: อัปเดตเป็นระยะตั้งแต่เดือนถึงหนึ่งปี
  • เย็น: อัปเดตทุก 5 ปีขึ้นไป

หลังจากผู้ใช้ GitHub ดำเนินการใดๆ ข้อมูล Git ทั้งหมดจะถูกจำลองไปยังศูนย์ข้อมูลหลายแห่งทั่วโลก การสำรองข้อมูล Git ปัญหา คำขอดึงข้อมูล และข้อมูลผู้ใช้ทั้งหมดบน GitHub จะถูกจัดเก็บไว้ในหลายแห่ง ข้อมูลนี้พร้อมใช้งานแบบเรียลไทม์ผ่าน GitHub API

นอกจากนี้ การจัดทำดัชนีแบบเรียกซ้ำยังจัดระเบียบโดยโปรแกรมรวบรวมข้อมูล GHTorrent ซึ่งจะอัปโหลดไฟล์เก็บถาวรเป็นรายวันหรือรายเดือน ผ่าน GH Archive สามารถรับรูปภาพจากไฟล์เก็บถาวรได้โดยใช้คำค้นหา BigQuery สำเนาโค้ดอื่น ๆ อยู่ใน Time Machine ที่รู้จักกันดีของ Internet Archive ซึ่งเก็บสำเนาไว้ในหลาย ๆ ที่ สุดท้ายนี้ Software Heritage Foundation จะรวบรวมข้อมูล GitHub เป็นประจำและเพิ่มพื้นที่เก็บข้อมูลสาธารณะไปยังไฟล์เก็บถาวรซึ่งมี API สาธารณะ

พื้นที่เก็บข้อมูล Arctic GitHub

ในวันที่ 2 กุมภาพันธ์ 2020 GitHub จะสร้างสำเนาของพื้นที่เก็บข้อมูลสาธารณะที่ใช้งานอยู่ทั้งหมด และวางไว้ในพื้นที่เก็บข้อมูล GitHub Arctic

ข้อมูลจะถูกจัดเก็บไว้ในม้วนฟิล์มขนาด 3500 ฟุตที่จัดทำโดย Piql ซึ่งเป็นบริษัทนอร์เวย์ที่เชี่ยวชาญด้านการจัดเก็บข้อมูลระยะยาว ตามการวัดของ ISO ฟิล์มโพลีเอสเตอร์ซิลเวอร์เฮไลด์นี้มีอายุการใช้งาน 500 ปี การทดสอบอายุจำลองแสดงให้เห็นว่าฟิล์ม Piql คงข้อมูลไว้ได้นานกว่าอย่างน้อยสองเท่า

นอกจากนี้ GitHub Archive ยังร่วมมือกับนักวิจัยโครงการ Microsoft Silica เพื่อเบิร์นที่เก็บข้อมูลสาธารณะทั้งหมดลงบนเวเฟอร์แก้วควอตซ์โดยใช้เลเซอร์เฟมโตวินาที สื่อนี้จะรับประกันความปลอดภัยของข้อมูลมานานกว่า 10 ปี

ที่เก็บโค้ด Arctic GitHub ถูกสร้างขึ้นบนพื้นฐานของ Arctic World Archive (AWA) ที่ระดับความลึก 250 เมตรในชั้นดินเยือกแข็งถาวร หอจดหมายเหตุตั้งอยู่ในอดีตเหมืองถ่านหินบนหมู่เกาะ Spitsbergen ซึ่งอยู่ไม่ไกลจากขั้วโลกเหนือมากนัก ภาวะโลกร้อนจะส่งผลกระทบต่อชั้นดินเยือกแข็งถาวรเพียงไม่กี่เมตร และจะไม่คุกคามเหมืองในอนาคตอันใกล้นี้ (หลายพันปี)

สฟาลบาร์ได้รับการควบคุม สนธิสัญญาระหว่างประเทศ เหมือนเขตปลอดทหาร ตาม GitHub เป็นหนึ่งในการตั้งถิ่นฐานของมนุษย์ที่ห่างไกลและมีเสถียรภาพทางภูมิรัฐศาสตร์มากที่สุดในโลก บริเวณใกล้เคียงมี World Seed Vault อันโด่งดัง ซึ่งเป็นความหวังหลักของมนุษยชาติในกรณีที่เกิดวันสิ้นโลก

GitHub ได้สร้างพื้นที่เก็บข้อมูลนับพันปีซึ่งจะเก็บรักษาพื้นที่เก็บข้อมูลโอเพ่นซอร์สไว้สำหรับลูกหลาน
Global Seed Vault ในสฟาลบาร์

AWA เป็นความคิดริเริ่มร่วมกันระหว่างบริษัทเหมืองแร่ Norske Spitsbergen Kulkompani (SNSK) ที่รัฐเป็นเจ้าของของนอร์เวย์ และ Piql AS ผู้ให้บริการอนุรักษ์ดิจิทัล ข้อมูลทางประวัติศาสตร์และวัฒนธรรมจากอิตาลี บราซิล นอร์เวย์ วาติกัน และประเทศอื่นๆ ได้ถูกเก็บไว้ที่นั่นแล้ว

GitHub ได้สร้างพื้นที่เก็บข้อมูลนับพันปีซึ่งจะเก็บรักษาพื้นที่เก็บข้อมูลโอเพ่นซอร์สไว้สำหรับลูกหลาน
Фото: กาย มาร์ติน/Bloomberg Businessweek

วงล้อรหัส GitHub จะถูกจัดเก็บไว้ในภาชนะด้านเหล็กภายในห้องที่ปิดสนิท สแน็ปช็อตของวันที่ 02.02.2020 จะรวมพื้นที่เก็บข้อมูล GitHub ที่ใช้งานอยู่ทั้งหมดและส่วนสำคัญของพื้นที่เก็บข้อมูลที่ไม่ได้ใช้งาน (ตัดสินโดยดาว การขึ้นต่อกัน ฯลฯ) ไฟล์ไบนารีทั้งหมดมีขนาดสูงสุด 100 KB แต่ละที่เก็บในไฟล์ tar แยกกัน ทุกอย่างควรพอดีกับสปูล 200 120 GB

นอกจากไฟล์เก็บถาวรแล้วยังมีแค็ตตาล็อกและคู่มือทางเทคนิคที่มนุษย์สามารถอ่านได้เกี่ยวกับการถอดรหัส QR รูปแบบไฟล์ การเข้ารหัสอักขระ และข้อมูลเมตาที่สำคัญอื่น ๆ เพื่อให้ผู้สืบทอดสามารถแปลงข้อมูลกลับไปเป็นซอร์สโค้ดได้

ไฟล์เก็บถาวรจะรวมคู่มือ Tech Tree ทั่วไปไว้ด้วย ในกรณีที่ผู้อ่านในอนาคตไม่มีคอมพิวเตอร์ที่ใช้งานได้ และต้องสร้างเทคโนโลยีใหม่ตั้งแต่ต้น

ที่มา: will.com

เพิ่มความคิดเห็น