ลดความเสี่ยงในการหยุดทำงานด้วยสถาปัตยกรรม Shared Nothing

หัวข้อการทนทานต่อข้อผิดพลาดในระบบจัดเก็บข้อมูลมีความเกี่ยวข้องอยู่เสมอ เนื่องจากในยุคของเราที่มีการจำลองเสมือนอย่างกว้างขวางและการรวมทรัพยากร ระบบจัดเก็บข้อมูลคือจุดเชื่อมโยงที่ความล้มเหลวจะไม่เพียงนำไปสู่อุบัติเหตุธรรมดาเท่านั้น แต่ยังรวมถึงการหยุดทำงานของบริการในระยะยาวด้วย ดังนั้นระบบจัดเก็บข้อมูลสมัยใหม่จึงมีส่วนประกอบที่ซ้ำกันจำนวนมาก (แม้แต่ตัวควบคุม) แต่การป้องกันดังกล่าวเพียงพอหรือไม่?

ลดความเสี่ยงในการหยุดทำงานด้วยสถาปัตยกรรม Shared Nothing

เมื่อระบุคุณลักษณะของระบบจัดเก็บข้อมูล ผู้จำหน่ายทุกรายจะต้องกล่าวถึงความทนทานต่อข้อผิดพลาดในระดับสูงของโซลูชันของตนเสมอ โดยมักจะเพิ่มคำว่า "โดยไม่มีจุดล้มเหลวแม้แต่จุดเดียว" เสมอ มาดูระบบจัดเก็บข้อมูลทั่วไปกันดีกว่า เพื่อหลีกเลี่ยงการหยุดทำงานในการบำรุงรักษา ระบบจัดเก็บข้อมูลจะทำซ้ำแหล่งจ่ายไฟ โมดูลระบายความร้อน พอร์ตอินพุต/เอาท์พุต ไดรฟ์ (เราหมายถึง RAID) และแน่นอนว่ารวมถึงตัวควบคุมด้วย หากคุณดูสถาปัตยกรรมนี้อย่างใกล้ชิด คุณจะสังเกตเห็นจุดที่อาจเกิดความล้มเหลวอย่างน้อยสองจุด ซึ่งเงียบไว้:

  1. ความพร้อมใช้งานของแบ็คเพลนเดี่ยว
  2. มีสำเนาข้อมูลหนึ่งชุด

แบ็คเพลนเป็นอุปกรณ์ที่ซับซ้อนทางเทคนิคที่ต้องผ่านการทดสอบอย่างจริงจังระหว่างการผลิต ดังนั้นจึงมีกรณีที่หายากมากที่จะล้มเหลวโดยสิ้นเชิง อย่างไรก็ตาม แม้ว่าในกรณีที่เกิดปัญหาบางส่วน เช่น ช่องใส่ไดรฟ์ที่ไม่ทำงาน ก็จำเป็นต้องเปลี่ยนระบบจัดเก็บข้อมูลใหม่โดยปิดระบบจัดเก็บข้อมูลอย่างสมบูรณ์

การสร้างสำเนาข้อมูลหลายชุดก็ไม่ใช่ปัญหาเมื่อมองแวบแรก ตัวอย่างเช่นฟังก์ชัน Clone ในระบบจัดเก็บข้อมูลซึ่งช่วยให้คุณสามารถอัปเดตสำเนาข้อมูลทั้งหมดได้ในบางช่วงเวลานั้นค่อนข้างแพร่หลาย อย่างไรก็ตาม ในกรณีที่เกิดปัญหากับการเล่นซ้ำแบบเดิม สำเนาจะไม่สามารถใช้งานได้เหมือนกับต้นฉบับ

ทางออกที่ชัดเจนในการเอาชนะข้อบกพร่องเหล่านี้คือการจำลองแบบไปยังระบบจัดเก็บข้อมูลอื่น หากเราละสายตาจากค่าใช้จ่ายฮาร์ดแวร์ที่คาดว่าจะเพิ่มขึ้นเป็นสองเท่า (เรายังคงถือว่าผู้ที่เลือกการตัดสินใจดังกล่าวคิดอย่างเพียงพอและยอมรับข้อเท็จจริงนี้ล่วงหน้า) จะยังมีต้นทุนที่เป็นไปได้สำหรับการจัดการการจำลองแบบในรูปแบบของใบอนุญาตเพิ่มเติม ซอฟต์แวร์และฮาร์ดแวร์ และที่สำคัญที่สุด คุณจะต้องตรวจสอบความสอดคล้องของข้อมูลที่จำลองแบบ เหล่านั้น. สร้างสตอเรจเวอร์ช่วลไลเซอร์/vSAN/อื่นๆ ซึ่งต้องใช้ทรัพยากรด้านเงินและเวลาด้วย

แอคเซลสตอร์ เมื่อสร้างระบบ High Availability เราได้ตั้งเป้าหมายที่จะกำจัดข้อบกพร่องที่กล่าวมาข้างต้น นี่คือลักษณะการตีความเทคโนโลยี Shared Nothing ซึ่งแปลอย่างหลวมๆ แปลว่า "โดยไม่ต้องใช้อุปกรณ์ที่ใช้ร่วมกัน"

แนวคิด ไม่มีอะไรแบ่งปัน สถาปัตยกรรมแสดงถึงการใช้สองโหนดอิสระ (ตัวควบคุม) ซึ่งแต่ละโหนดมีชุดข้อมูลของตัวเอง การจำลองแบบซิงโครนัสเกิดขึ้นระหว่างโหนดผ่านอินเทอร์เฟซ InfiniBand 56G ซึ่งโปร่งใสอย่างสมบูรณ์กับซอฟต์แวร์ที่ทำงานบนระบบจัดเก็บข้อมูล ด้วยเหตุนี้จึงไม่จำเป็นต้องมีการใช้สตอเรจเวอร์ช่วลไลเซอร์ เอเจนต์ซอฟต์แวร์ ฯลฯ

ในเชิงกายภาพ โซลูชันแบบสองโหนดจาก AccelStor สามารถนำไปใช้ได้ในสองรุ่น:

  • H510 — อิงตามเซิร์ฟเวอร์ Twin ในกรณี 2U หากต้องการประสิทธิภาพปานกลางและความจุสูงสุด 22TB
  • H710 — ขึ้นอยู่กับเซิร์ฟเวอร์ 2U แต่ละตัว หากต้องการประสิทธิภาพสูงและความจุขนาดใหญ่ (สูงสุด 57TB)

ลดความเสี่ยงในการหยุดทำงานด้วยสถาปัตยกรรม Shared Nothing

รุ่น H510 ที่ใช้เซิร์ฟเวอร์ Twin

ลดความเสี่ยงในการหยุดทำงานด้วยสถาปัตยกรรม Shared Nothing

รุ่น H710 ขึ้นอยู่กับเซิร์ฟเวอร์แต่ละตัว

การใช้ฟอร์มแฟคเตอร์ที่แตกต่างกันนั้นเกิดจากความต้องการ SSD ในจำนวนที่แตกต่างกันเพื่อให้ได้ปริมาณและประสิทธิภาพที่กำหนด นอกจากนี้ แพลตฟอร์ม Twin ยังมีราคาถูกกว่าและช่วยให้คุณสามารถนำเสนอโซลูชันที่ราคาไม่แพงกว่า แม้ว่าจะมี “ข้อเสีย” ที่มีเงื่อนไขบางประการในรูปแบบของแบ็คเพลนเดี่ยวก็ตาม อย่างอื่นทั้งหมดรวมถึงหลักการทำงานเหมือนกันหมดสำหรับทั้งสองรุ่น

ชุดข้อมูลสำหรับแต่ละโหนดมีสองกลุ่ม FlexiRemap, แถมอะไหล่ร้อนอีก 2 อัน แต่ละกลุ่มสามารถทนต่อความล้มเหลวของ SSD หนึ่งตัวได้ คำขอขาเข้าทั้งหมดเพื่อบันทึกโหนดตาม อุดมการณ์ FlexiRemap สร้างบล็อกขนาด 4KB ขึ้นใหม่เป็นบล็อกต่อเนื่องกัน ซึ่งจากนั้นจะถูกเขียนลงใน SSD ในโหมดที่สะดวกสบายที่สุดสำหรับบล็อกเหล่านั้น (การบันทึกตามลำดับ) นอกจากนี้ โฮสต์จะได้รับการยืนยันการบันทึกหลังจากที่ข้อมูลถูกวางลงบน SSD แล้วเท่านั้น เช่น โดยไม่ต้องแคชใน RAM ผลลัพธ์ที่ได้คือประสิทธิภาพการเขียนสูงถึง 600K IOPS และการอ่าน 1M+ IOPS (รุ่น H710)

ตามที่กล่าวไว้ข้างต้น ชุดข้อมูลจะซิงโครไนซ์แบบเรียลไทม์ผ่านอินเทอร์เฟซ InfiniBand 56G ซึ่งมีทรูพุตสูงและเวลาแฝงต่ำ เพื่อให้การใช้ช่องทางการสื่อสารมีประสิทธิภาพสูงสุดในการส่งแพ็กเก็ตขนาดเล็ก เพราะ มีช่องทางการสื่อสารเพียงช่องทางเดียว ลิงก์ 1GbE เฉพาะใช้สำหรับตรวจสอบอัตราการเต้นของหัวใจเพิ่มเติม มีเพียงการเต้นของหัวใจเท่านั้นที่ถูกส่งผ่าน ดังนั้นจึงไม่มีข้อกำหนดสำหรับลักษณะความเร็ว

กรณีเพิ่มความจุของระบบ (สูงสุด 400+TB) เนื่องจาก ชั้นวางขยาย พวกเขายังเชื่อมต่อกันเป็นคู่เพื่อรักษาแนวคิด "ไม่มีจุดเดียวของความล้มเหลว"

สำหรับการปกป้องข้อมูลเพิ่มเติม (นอกเหนือจากข้อเท็จจริงที่ว่า AccelStor มีสำเนาสองชุดแล้ว) อัลกอริธึมลักษณะการทำงานพิเศษจะใช้ในกรณีที่ SSD ใด ๆ ล้มเหลว หาก SSD ล้มเหลว โหนดจะเริ่มสร้างข้อมูลใหม่บนไดรฟ์สำรองสำรองตัวใดตัวหนึ่ง กลุ่ม FlexiRemap ซึ่งอยู่ในสถานะลดระดับจะเปลี่ยนไปใช้โหมดอ่านอย่างเดียว การดำเนินการนี้ทำเพื่อกำจัดการรบกวนระหว่างการเขียนและการสร้างใหม่บนดิสก์สำรองข้อมูล ซึ่งท้ายที่สุดแล้วจะช่วยเร่งกระบวนการกู้คืนและลดเวลาที่ระบบอาจมีความเสี่ยง เมื่อสร้างใหม่เสร็จแล้ว โหนดจะกลับสู่โหมดอ่าน-เขียนปกติ

ลดความเสี่ยงในการหยุดทำงานด้วยสถาปัตยกรรม Shared Nothing

แน่นอนว่าเช่นเดียวกับระบบอื่นๆ ประสิทธิภาพโดยรวมจะลดลงในระหว่างการสร้างใหม่ (ท้ายที่สุด กลุ่ม FlexiRemap กลุ่มใดกลุ่มหนึ่งจะไม่ทำงานสำหรับการบันทึก) แต่กระบวนการกู้คืนจะเกิดขึ้นโดยเร็วที่สุด ซึ่งทำให้ระบบ AccelStor แตกต่างจากโซลูชันจากผู้ขายรายอื่น

คุณสมบัติที่มีประโยชน์อีกประการหนึ่งของเทคโนโลยีสถาปัตยกรรม Nothing Shared คือการทำงานของโหนดในโหมดที่เรียกว่าโหมดแอคทีฟแอคทีฟจริง ต่างจากสถาปัตยกรรม “คลาสสิก” ที่ซึ่งมีคอนโทรลเลอร์เพียงตัวเดียวเท่านั้นที่เป็นเจ้าของวอลุ่ม/พูลเฉพาะ และตัวควบคุมตัวที่สองเพียงดำเนินการ I/O ในระบบ แอคเซลสตอร์ แต่ละโหนดทำงานกับชุดข้อมูลของตัวเองและไม่ส่งคำขอไปยัง "เพื่อนบ้าน" เป็นผลให้ประสิทธิภาพโดยรวมของระบบได้รับการปรับปรุงเนื่องจากการประมวลผลคำขอ I/O แบบขนานโดยโหนดและการเข้าถึงไดรฟ์ นอกจากนี้ แทบไม่มีสิ่งที่เรียกว่าการเฟลโอเวอร์ เนื่องจากไม่จำเป็นต้องถ่ายโอนการควบคุมวอลุ่มไปยังโหนดอื่นในกรณีที่เกิดความล้มเหลว

หากเราเปรียบเทียบเทคโนโลยีสถาปัตยกรรม Nothing Shared กับการทำสำเนาระบบจัดเก็บข้อมูลเต็มรูปแบบ เมื่อมองแวบแรก จะด้อยกว่าการใช้งานการกู้คืนระบบเต็มรูปแบบในด้านความยืดหยุ่นเล็กน้อย โดยเฉพาะอย่างยิ่งสำหรับการจัดสายการสื่อสารระหว่างระบบจัดเก็บข้อมูล ดังนั้น ในรุ่น H710 จึงเป็นไปได้ที่จะกระจายโหนดในระยะทางสูงสุด 100 ม. โดยใช้สายเคเบิลออปติกแบบแอคทีฟ InfiniBand ที่มีราคาไม่สูงมาก แต่แม้ว่าจะเปรียบเทียบกับการใช้งานการจำลองแบบซิงโครนัสตามปกติจากผู้ขายรายอื่นผ่าน FibreChannel ที่มีอยู่ แม้จะอยู่ในระยะทางที่ไกลกว่าก็ตาม โซลูชันจาก AccelStor จะมีราคาถูกกว่าและติดตั้ง/ใช้งานง่ายกว่า เนื่องจาก ไม่จำเป็นต้องติดตั้งสตอเรจเวอร์ชวลไลเซอร์และ/หรือรวมเข้ากับซอฟต์แวร์ (ซึ่งโดยหลักการแล้วไม่สามารถทำได้เสมอไป) นอกจากนี้ อย่าลืมว่าโซลูชัน AccelStor เป็นอาร์เรย์ Flash ทั้งหมดที่มีประสิทธิภาพสูงกว่าระบบจัดเก็บข้อมูล "คลาสสิก" ที่มี SSD เท่านั้น

ลดความเสี่ยงในการหยุดทำงานด้วยสถาปัตยกรรม Shared Nothing

เมื่อใช้สถาปัตยกรรม Nothing Shared ของ AccelStor จะทำให้ระบบจัดเก็บข้อมูลมีความพร้อมใช้งาน 99.9999% ในราคาที่สมเหตุสมผล พร้อมด้วยความน่าเชื่อถือสูงของโซลูชัน รวมถึงการใช้สำเนาข้อมูลสองชุด และประสิทธิภาพที่น่าประทับใจด้วยอัลกอริธึมที่เป็นกรรมสิทธิ์ FlexiRemap,โซลูชั่นจาก แอคเซลสตอร์ เป็นตัวเลือกที่ยอดเยี่ยมสำหรับตำแหน่งสำคัญในการสร้างศูนย์ข้อมูลที่ทันสมัย

ที่มา: will.com

เพิ่มความคิดเห็น