การทดสอบการชนของระบบจัดเก็บข้อมูล AERODISK ENGINE N2 การทดสอบความแข็งแรง

การทดสอบการชนของระบบจัดเก็บข้อมูล AERODISK ENGINE N2 การทดสอบความแข็งแรง

สวัสดีทุกคน! ด้วยบทความนี้ AERODISK เปิดบล็อกเกี่ยวกับHabré ไชโยสหาย!

บทความก่อนหน้านี้เกี่ยวกับHabré กล่าวถึงคำถามเกี่ยวกับสถาปัตยกรรมและการกำหนดค่าพื้นฐานของระบบจัดเก็บข้อมูล ในบทความนี้ เราจะพิจารณาคำถามที่ไม่เคยกล่าวถึงมาก่อน แต่มักถูกถามบ่อยๆ เกี่ยวกับความทนทานต่อความเสียหายของระบบจัดเก็บข้อมูล AERODISK ENGINE ทีมงานของเราจะทำทุกอย่างเพื่อให้แน่ใจว่าระบบจัดเก็บข้อมูล AERODISK จะหยุดทำงาน กล่าวคือ ทำลายมัน

มันเกิดขึ้นที่บทความเกี่ยวกับประวัติของบริษัทของเรา เกี่ยวกับผลิตภัณฑ์ของเรา รวมถึงตัวอย่างของการดำเนินการที่ประสบความสำเร็จ ต่างก็แขวนอยู่บน Habré ซึ่ง ขอขอบคุณพันธมิตรของเรา - บริษัท TS Solution และ Softline

ดังนั้นฉันจะไม่ฝึกทักษะการจัดการการคัดลอกและวางที่นี่ แต่จะให้ลิงก์ไปยังต้นฉบับของบทความเหล่านี้:

ฉันอยากจะแบ่งปันข่าวดีเช่นกัน แต่แน่นอนว่าฉันจะเริ่มต้นด้วยปัญหา ในฐานะผู้จำหน่ายรายใหม่ ท่ามกลางต้นทุนอื่นๆ ต้องเผชิญกับข้อเท็จจริงที่ว่าวิศวกรและผู้ดูแลระบบจำนวนมากไม่ทราบวิธีใช้งานระบบจัดเก็บข้อมูลของเราอย่างเหมาะสม
เป็นที่ชัดเจนว่าการจัดการระบบจัดเก็บข้อมูลส่วนใหญ่ดูจะเหมือนกันโดยประมาณจากมุมมองของผู้ดูแลระบบ แต่ผู้ผลิตแต่ละรายมีลักษณะเฉพาะของตนเอง และเราก็ไม่มีข้อยกเว้นที่นี่

ดังนั้น เพื่อให้งานฝึกอบรมผู้เชี่ยวชาญด้านไอทีง่ายขึ้น เราจึงตัดสินใจอุทิศปีนี้ให้กับการศึกษาฟรี เพื่อทำเช่นนี้ ในเมืองใหญ่หลายแห่งของรัสเซีย เรากำลังเปิดเครือข่ายของ AERODISK Competence Centers ซึ่งผู้เชี่ยวชาญด้านเทคนิคที่สนใจสามารถเข้าเรียนหลักสูตรได้ฟรี และรับใบรับรองในการจัดการระบบจัดเก็บข้อมูล AERODISK ENGINE

ในแต่ละ Competence Center เราจะติดตั้งแท่นสาธิตเต็มรูปแบบจากระบบจัดเก็บข้อมูล AERODISK และเซิร์ฟเวอร์จริง ซึ่งครูของเราจะทำการฝึกอบรมแบบเห็นหน้ากัน เราจะเผยแพร่ตารางการทำงานของ Competence Centers เมื่อมีการปรากฏตัว แต่เราได้เปิดศูนย์ใน Nizhny Novgorod แล้ว และเมือง Krasnodar ก็อยู่ถัดไป สามารถสมัครอบรมได้ตามลิงค์ด้านล่าง ต่อไปนี้เป็นข้อมูลที่ทราบในปัจจุบันเกี่ยวกับเมืองและวันที่:

  • Nizhny Novgorod (เปิดแล้ว – คุณสามารถสมัครได้ที่นี่ https://aerodisk.promo/nn/);
    จนถึงวันที่ 16 เมษายน 2019 ท่านสามารถเยี่ยมชมศูนย์ได้ตลอดเวลาทำการ และในวันที่ 16 เมษายน 2019 จะมีการจัดอบรมหลักสูตรใหญ่
  • ครัสโนดาร์ (เปิดเร็วๆ นี้ - คุณสามารถสมัครได้ที่นี่ https://aerodisk.promo/krsnd/ );
    ตั้งแต่วันที่ 9 เมษายน ถึง 25 เมษายน 2019 สามารถเยี่ยมชมศูนย์ได้ทุกเวลาทำการ และในวันที่ 25 เมษายน 2019 จะมีการจัดอบรมหลักสูตรใหญ่
  • Yekaterinburg (เปิดเร็วๆ นี้ ติดตามข้อมูลบนเว็บไซต์ของเราหรือบน Habré);
    พฤษภาคม-มิถุนายน 2019
  • โนโว (ติดตามข้อมูลบนเว็บไซต์ของเราหรือบนHabré)
    ตุลาคม 2019
  • ครัสโนยา (ติดตามข้อมูลบนเว็บไซต์ของเราหรือบนHabré)
    พฤศจิกายน 2019.

และแน่นอนว่า หากมอสโกอยู่ไม่ไกลจากคุณ คุณสามารถเยี่ยมชมสำนักงานของเราในมอสโกและรับการฝึกอบรมที่คล้ายกันได้ตลอดเวลา

ทั้งหมด. เราทำการตลาดเสร็จแล้ว มาดูเทคโนโลยีกันดีกว่า!

ที่ Habré เราจะเผยแพร่บทความทางเทคนิคเกี่ยวกับผลิตภัณฑ์ของเรา การทดสอบน้ำหนักบรรทุก การเปรียบเทียบ คุณสมบัติการใช้งาน และการใช้งานที่น่าสนใจของเราเป็นประจำ

การทดสอบการชนของระบบจัดเก็บข้อมูล AERODISK ENGINE N2 การทดสอบความแข็งแรง

คำเตือน! หลังจากอ่านบทความแล้วคุณสามารถพูดได้ว่า: แน่นอนว่าผู้ขายจะตรวจสอบตัวเองเพื่อให้ทุกอย่างทำงานได้ "ปัง" สภาพเรือนกระจก ฯลฯ ฉันจะตอบ: ไม่มีอะไรแบบนั้น! เราตั้งอยู่ที่นี่ใกล้กับคุณและคุณสามารถมาหาเราได้ตลอดเวลา (ในมอสโกหรือคณะกรรมการกลาง) และทดสอบระบบจัดเก็บข้อมูลของเราไม่เหมือนกับคู่แข่งในต่างประเทศ ดังนั้นจึงไม่สมเหตุสมผลเลยที่เราจะปรับผลลัพธ์ให้เป็นภาพในอุดมคติของโลกเพราะว่า เราตรวจสอบได้ง่ายมาก สำหรับผู้ที่ขี้เกียจไปและไม่มีเวลา เราสามารถจัดการทดสอบระยะไกลได้ เรามีห้องปฏิบัติการพิเศษสำหรับเรื่องนี้ ติดต่อเรา.

อัคตุง-2! การทดสอบนี้ไม่ใช่การทดสอบโหลดเพราะว่า ที่นี่เราสนใจเฉพาะความทนทานต่อข้อผิดพลาดเท่านั้น ในอีกสองสามสัปดาห์ เราจะเตรียมแท่นที่มีประสิทธิภาพมากขึ้นและดำเนินการทดสอบโหลดของระบบจัดเก็บข้อมูล โดยเผยแพร่ผลลัพธ์ที่นี่ (อย่างไรก็ตาม คำขอสำหรับการทดสอบได้รับการยอมรับ)

งั้นเรามาทำลายมันกันเถอะ

แท่นทดสอบ

ขาตั้งของเราประกอบด้วยฮาร์ดแวร์ดังต่อไปนี้:

  • 1 x ระบบจัดเก็บข้อมูล Aerodisk Engine N2 (ตัวควบคุม 2 ตัว, แคช 64GB, พอร์ต 8xFC 8Gb/s, พอร์ต 4xEthernet 10Gb/s SFP+, พอร์ต 4xEthernet 1Gb/s) ดิสก์ต่อไปนี้ได้รับการติดตั้งในระบบจัดเก็บข้อมูล:
  • ดิสก์ SAS SSD 4 แผ่น 900 GB;
  • ดิสก์ 12 x SAS 10k 1,2 TB;
  • 1 x เซิร์ฟเวอร์กายภาพพร้อม Windows Server 2016 (2xeon E5 2667 v3, 96GB RAM, 2xFC พอร์ต 8Gb/s, 2xEthernet พอร์ต 10Gb/s SFP+);
  • สวิตช์ 2 x SAN 8G;
  • สวิตช์ LAN 2G 10 ตัว;

เราเชื่อมต่อเซิร์ฟเวอร์กับระบบจัดเก็บข้อมูลผ่านสวิตช์ผ่านทั้ง FC และ 10G Ethernet แผนภาพขาตั้งอยู่ด้านล่าง

การทดสอบการชนของระบบจัดเก็บข้อมูล AERODISK ENGINE N2 การทดสอบความแข็งแรง

ส่วนประกอบที่เราต้องการ เช่น MPIO และ iSCSI Initiator ได้รับการติดตั้งบน Windows Server
โซนได้รับการกำหนดค่าบนสวิตช์ FC, VLAN ที่เกี่ยวข้องได้รับการกำหนดค่าบนสวิตช์ LAN และติดตั้ง MTU 9000 บนพอร์ตจัดเก็บข้อมูล สวิตช์ และโฮสต์ (วิธีทำทั้งหมดนี้อธิบายไว้ในเอกสารประกอบของเรา ดังนั้นเราจะไม่อธิบาย กระบวนการนี้ที่นี่)

วิธีการทดสอบ

แผนการทดสอบการชนมีดังนี้:

  • ตรวจสอบความล้มเหลวของพอร์ต FC และ Ethernet
  • การตรวจสอบไฟฟ้าขัดข้อง
  • การตรวจสอบความล้มเหลวของคอนโทรลเลอร์
  • การตรวจสอบความล้มเหลวของดิสก์ในกลุ่ม/พูล

การทดสอบทั้งหมดจะดำเนินการภายใต้สภาวะโหลดสังเคราะห์ ซึ่งเราจะสร้างขึ้นโดยโปรแกรม IOMETER ในแบบคู่ขนาน เราจะทำการทดสอบเดียวกัน แต่ภายใต้เงื่อนไขของการคัดลอกไฟล์ขนาดใหญ่ไปยังระบบจัดเก็บข้อมูล

การกำหนดค่า IOmeter เป็นดังนี้:

  • อ่าน/เขียน – 70/30
  • บล็อก – 128k (เราตัดสินใจล้างระบบจัดเก็บข้อมูลเป็นบล็อกใหญ่)
  • จำนวนเธรด – 128 (ซึ่งใกล้เคียงกับปริมาณการผลิตมาก)
  • สุ่มเต็มๆ
  • จำนวนคนงาน – 4 (2 สำหรับ FC, 2 สำหรับ iSCSI)

การทดสอบการชนของระบบจัดเก็บข้อมูล AERODISK ENGINE N2 การทดสอบความแข็งแรง
การทดสอบการชนของระบบจัดเก็บข้อมูล AERODISK ENGINE N2 การทดสอบความแข็งแรง

การทดสอบมีวัตถุประสงค์ดังต่อไปนี้:

  1. ตรวจสอบให้แน่ใจว่ากระบวนการโหลดและคัดลอกสังเคราะห์จะไม่ขัดจังหวะหรือทำให้เกิดข้อผิดพลาดภายใต้สถานการณ์ความล้มเหลวต่างๆ
  2. ตรวจสอบให้แน่ใจว่ากระบวนการสลับพอร์ต ตัวควบคุม ฯลฯ เป็นไปโดยอัตโนมัติอย่างเพียงพอ และไม่จำเป็นต้องมีการดำเนินการของผู้ดูแลระบบในกรณีที่เกิดความล้มเหลว (นั่นคือในระหว่างการเปลี่ยนระบบเมื่อเกิดข้อผิดพลาด เราไม่ได้พูดถึงการย้อนกลับเมื่อเกิดข้อผิดพลาด)
  3. ตรวจสอบให้แน่ใจว่าข้อมูลในบันทึกแสดงอย่างถูกต้อง

การเตรียมโฮสต์และระบบจัดเก็บข้อมูล

เรากำหนดค่าการเข้าถึงบล็อกบนระบบจัดเก็บข้อมูลโดยใช้พอร์ต FC และอีเธอร์เน็ต (FC และ iSCSI ตามลำดับ) พวกจาก TS Solution อธิบายรายละเอียดวิธีการทำเช่นนี้ในบทความก่อนหน้า (https://habr.com/ru/company/tssolution/blog/432876/). และแน่นอนว่าไม่มีใครยกเลิกคู่มือและหลักสูตร

เราตั้งค่ากลุ่มไฮบริดโดยใช้ไดรฟ์ทั้งหมดที่เรามี เพิ่มดิสก์ SSD 2 ตัวลงในแคช เพิ่มดิสก์ SSD 2 ตัวเป็นระดับพื้นที่จัดเก็บข้อมูลเพิ่มเติม (ระดับออนไลน์) เราจัดกลุ่มไดรฟ์ SAS12k 10 ตัวเป็น RAID-60P (triple parity) เพื่อตรวจสอบความล้มเหลวของไดรฟ์สามตัวในกลุ่มพร้อมกัน เหลือดิสก์หนึ่งแผ่นสำหรับการเปลี่ยนอัตโนมัติ

การทดสอบการชนของระบบจัดเก็บข้อมูล AERODISK ENGINE N2 การทดสอบความแข็งแรง

เราเชื่อมต่อ LUN สองตัว (อันหนึ่งผ่าน FC และอีกอันผ่าน iSCSI)

การทดสอบการชนของระบบจัดเก็บข้อมูล AERODISK ENGINE N2 การทดสอบความแข็งแรง

เจ้าของ LUN ทั้งสองคือตัวควบคุม Engine-0

การทดสอบการชนของระบบจัดเก็บข้อมูล AERODISK ENGINE N2 การทดสอบความแข็งแรง

มาเริ่มการทดสอบกัน

เราเปิดใช้งาน IOMETER ด้วยการกำหนดค่าด้านบน

การทดสอบการชนของระบบจัดเก็บข้อมูล AERODISK ENGINE N2 การทดสอบความแข็งแรง

เราบันทึกปริมาณงาน 1.8 GB/s และเวลาแฝง 3 มิลลิวินาที ไม่มีข้อผิดพลาด (จำนวนข้อผิดพลาดทั้งหมด)

ในเวลาเดียวกัน จากไดรฟ์ในเครื่อง “C” ของโฮสต์ของเรา เราจะเริ่มคัดลอกไฟล์ขนาดใหญ่ 100GB สองไฟล์ไปยัง LUN ที่เก็บข้อมูล FC และ iSCSI (ไดรฟ์ E และ G ใน Windows) แบบขนานโดยใช้อินเทอร์เฟซอื่น

ด้านบนคือขั้นตอนการคัดลอกไปยัง LUN FC และด้านล่างเป็น iSCSI

การทดสอบการชนของระบบจัดเก็บข้อมูล AERODISK ENGINE N2 การทดสอบความแข็งแรง

การทดสอบ #1: การปิดใช้งานพอร์ต I/O

เราเข้าใกล้ระบบจัดเก็บข้อมูลจากด้านหลัง))) และด้วยการขยับมือเล็กน้อยเราจะดึงสาย FC และ Ethernet 10G ทั้งหมดออกจากตัวควบคุม Engine-0 ราวกับว่ามีพนักงานทำความสะอาดที่มีไม้ถูพื้นเดินผ่านมาและตัดสินใจล้างพื้นตรงบริเวณที่มีน้ำมูกและสายเคเบิลวางอยู่ (นั่นคือ ตัวควบคุมยังคงทำงานอยู่ แต่พอร์ต I/O เสีย)

การทดสอบการชนของระบบจัดเก็บข้อมูล AERODISK ENGINE N2 การทดสอบความแข็งแรง

มาดู IOMETER และการคัดลอกไฟล์กัน ปริมาณงานลดลงเหลือ 0,5 GB/s แต่กลับสู่ระดับก่อนหน้าอย่างรวดเร็ว (ในเวลาประมาณ 4-5 วินาที) ไม่มีข้อผิดพลาด

การทดสอบการชนของระบบจัดเก็บข้อมูล AERODISK ENGINE N2 การทดสอบความแข็งแรง

การคัดลอกไฟล์ไม่ได้หยุดลง ความเร็วลดลง แต่ก็ไม่ได้สำคัญแต่อย่างใด (จาก 840 MB/s ลดลงเหลือ 720 MB/s) การคัดลอกไม่ได้หยุดลง

เราดูบันทึกของระบบจัดเก็บข้อมูลและดูข้อความเกี่ยวกับพอร์ตที่ไม่พร้อมใช้งานและการย้ายตำแหน่งกลุ่มโดยอัตโนมัติ

การทดสอบการชนของระบบจัดเก็บข้อมูล AERODISK ENGINE N2 การทดสอบความแข็งแรง

แผงข้อมูลยังบอกเราด้วยว่าทุกอย่างไม่ค่อยดีนักกับพอร์ต FC

การทดสอบการชนของระบบจัดเก็บข้อมูล AERODISK ENGINE N2 การทดสอบความแข็งแรง

ระบบจัดเก็บข้อมูลรอดพ้นจากความล้มเหลวของพอร์ต I/O ได้สำเร็จ

การทดสอบหมายเลข 2 การปิดใช้งานตัวควบคุมการจัดเก็บข้อมูล

แทบจะในทันที (หลังจากเสียบสายเคเบิลกลับเข้าไปในระบบจัดเก็บข้อมูลแล้ว) เราจึงตัดสินใจปิดระบบจัดเก็บข้อมูลโดยดึงตัวควบคุมออกจากแชสซี

เราเข้าใกล้ระบบจัดเก็บข้อมูลจากด้านหลังอีกครั้ง (เราชอบมัน))) และคราวนี้เราดึงตัวควบคุม Engine-1 ออกมาซึ่งในขณะนี้เป็นเจ้าของ RDG (ซึ่งกลุ่มย้ายไป)

สถานการณ์ใน IOmeter มีดังนี้ I/O หยุดประมาณ 5 วินาที ข้อผิดพลาดไม่สะสม

การทดสอบการชนของระบบจัดเก็บข้อมูล AERODISK ENGINE N2 การทดสอบความแข็งแรง

หลังจากผ่านไป 5 วินาที I/O จะกลับมาทำงานต่อด้วยปริมาณงานเท่าเดิม แต่มีเวลาแฝงอยู่ที่ 35 มิลลิวินาที (เวลาแฝงจะถูกแก้ไขหลังจากนั้นประมาณสองสามนาที) ดังที่เห็นได้จากภาพหน้าจอ ค่าจำนวนข้อผิดพลาดทั้งหมดคือ 0 นั่นคือไม่มีข้อผิดพลาดในการเขียนหรือการอ่าน

การทดสอบการชนของระบบจัดเก็บข้อมูล AERODISK ENGINE N2 การทดสอบความแข็งแรง

มาดูการคัดลอกไฟล์ของเรากัน อย่างที่คุณเห็น มันไม่ได้ถูกขัดจังหวะ ประสิทธิภาพลดลงเล็กน้อย แต่โดยรวมแล้วทุกอย่างกลับมาเท่าเดิม ~ 800 MB/s

การทดสอบการชนของระบบจัดเก็บข้อมูล AERODISK ENGINE N2 การทดสอบความแข็งแรง

เราไปที่ระบบจัดเก็บข้อมูลและเห็นคำสาปในแผงข้อมูลที่ระบุว่าตัวควบคุม Engine-1 ไม่พร้อมใช้งาน (แน่นอนเราฆ่ามันแล้ว)

การทดสอบการชนของระบบจัดเก็บข้อมูล AERODISK ENGINE N2 การทดสอบความแข็งแรง

เรายังเห็นรายการที่คล้ายกันในบันทึกด้วย

การทดสอบการชนของระบบจัดเก็บข้อมูล AERODISK ENGINE N2 การทดสอบความแข็งแรง

ตัวควบคุมการจัดเก็บข้อมูลยังรอดชีวิตจากความล้มเหลวอีกด้วย ได้สำเร็จ

การทดสอบหมายเลข 3: การตัดการเชื่อมต่อแหล่งจ่ายไฟ

ในกรณีที่เราเริ่มคัดลอกไฟล์อีกครั้ง แต่ไม่ได้หยุด IOMETER
เราดึงหน่วยจ่ายไฟ

การทดสอบการชนของระบบจัดเก็บข้อมูล AERODISK ENGINE N2 การทดสอบความแข็งแรง

มีการเพิ่มการแจ้งเตือนอื่นในระบบจัดเก็บข้อมูลในแผงข้อมูล

การทดสอบการชนของระบบจัดเก็บข้อมูล AERODISK ENGINE N2 การทดสอบความแข็งแรง

นอกจากนี้ในเมนูเซ็นเซอร์เราจะเห็นว่าเซ็นเซอร์ที่เกี่ยวข้องกับแหล่งจ่ายไฟที่ดึงออกมาเปลี่ยนเป็นสีแดง

การทดสอบการชนของระบบจัดเก็บข้อมูล AERODISK ENGINE N2 การทดสอบความแข็งแรง

ระบบจัดเก็บข้อมูลยังคงทำงานต่อไป ความล้มเหลวของหน่วยจ่ายไฟไม่ส่งผลกระทบต่อการทำงานของระบบจัดเก็บข้อมูล แต่อย่างใด จากมุมมองของโฮสต์ ความเร็วในการคัดลอกและตัวบ่งชี้ IOMETER ยังคงไม่เปลี่ยนแปลง

ผ่านการทดสอบไฟฟ้าขัดข้อง ได้สำเร็จ

ก่อนการทดสอบขั้นสุดท้าย เราตัดสินใจที่จะทำให้ระบบจัดเก็บข้อมูลกลับมามีชีวิตอีกครั้งเล็กน้อย ใส่ตัวควบคุมและหน่วยจ่ายไฟกลับคืน และจัดวางสายเคเบิลตามลำดับ ซึ่งระบบจัดเก็บข้อมูลแจ้งให้เราทราบอย่างยินดีพร้อมไอคอนสีเขียวในแผงสถานภาพ .

การทดสอบการชนของระบบจัดเก็บข้อมูล AERODISK ENGINE N2 การทดสอบความแข็งแรง

การทดสอบหมายเลข 4 ความล้มเหลวของดิสก์สามตัวในกลุ่ม

ก่อนการทดสอบนี้ เราได้ดำเนินการขั้นตอนการเตรียมการเพิ่มเติม ความจริงก็คือระบบจัดเก็บข้อมูลของ ENGINE มอบสิ่งที่มีประโยชน์มาก - นโยบายการสร้างใหม่ที่แตกต่างกัน TS Solution เขียนเกี่ยวกับฟีเจอร์นี้ไว้ก่อนหน้านี้ แต่เรามาจำสาระสำคัญของมันกันดีกว่า ผู้ดูแลระบบพื้นที่เก็บข้อมูลสามารถระบุลำดับความสำคัญสำหรับการจัดสรรทรัพยากรระหว่างการสร้างใหม่ ไม่ว่าจะไปในทิศทางของประสิทธิภาพ I/O นั่นคือ การสร้างใหม่ใช้เวลานานกว่า แต่ไม่มีการลดประสิทธิภาพลง หรือไปในทิศทางของความเร็วในการสร้างใหม่แต่ผลผลิตจะลดลง หรือตัวเลือกที่สมดุล เนื่องจากประสิทธิภาพของพื้นที่จัดเก็บข้อมูลในระหว่างการสร้างกลุ่มดิสก์ใหม่เป็นเรื่องที่ผู้ดูแลระบบปวดหัวอยู่เสมอ เราจะทดสอบนโยบายโดยคำนึงถึงประสิทธิภาพ I/O และแลกกับความเร็วในการสร้างใหม่

การทดสอบการชนของระบบจัดเก็บข้อมูล AERODISK ENGINE N2 การทดสอบความแข็งแรง

ตอนนี้เรามาตรวจสอบความล้มเหลวของดิสก์กันดีกว่า นอกจากนี้เรายังเปิดใช้งานการบันทึกไปยัง LUN (ไฟล์และ IOMETER) เนื่องจากเรามีกลุ่มที่มีความเท่าเทียมกันสามเท่า (RAID-60P) ซึ่งหมายความว่าระบบจะต้องทนต่อความล้มเหลวของดิสก์สามตัวและหลังจากความล้มเหลวการเปลี่ยนอัตโนมัติจะต้องทำงานดิสก์หนึ่งตัวจะต้องแทนที่ดิสก์ตัวใดตัวหนึ่งที่ล้มเหลว ใน RDG และการสร้างใหม่จะต้องเริ่มต้นจากนั้น

เริ่ม. ขั้นแรกผ่านอินเทอร์เฟซการจัดเก็บข้อมูล เรามาเน้นดิสก์ที่เราต้องการดึงออก (เพื่อไม่ให้พลาดและดึงดิสก์การเปลี่ยนแปลงอัตโนมัติ)

การทดสอบการชนของระบบจัดเก็บข้อมูล AERODISK ENGINE N2 การทดสอบความแข็งแรง

เราตรวจสอบข้อบ่งชี้บนฮาร์ดแวร์ ทุกอย่างเรียบร้อยดี เราเห็นดิสก์ที่ไฮไลต์สามดิสก์

การทดสอบการชนของระบบจัดเก็บข้อมูล AERODISK ENGINE N2 การทดสอบความแข็งแรง

และเราดึงดิสก์ทั้งสามนี้ออกมา

การทดสอบการชนของระบบจัดเก็บข้อมูล AERODISK ENGINE N2 การทดสอบความแข็งแรง

มาดูกันว่าเจ้าบ้านมีอะไรบ้าง และนั่น... ไม่มีอะไรพิเศษเกิดขึ้น

การทดสอบการชนของระบบจัดเก็บข้อมูล AERODISK ENGINE N2 การทดสอบความแข็งแรง
การทดสอบการชนของระบบจัดเก็บข้อมูล AERODISK ENGINE N2 การทดสอบความแข็งแรง

ตัวบ่งชี้การคัดลอก (สูงกว่าตอนเริ่มต้นเนื่องจากแคชอุ่นเครื่องแล้ว) และ IOMETER จะไม่เปลี่ยนแปลงมากนักเมื่อนำดิสก์ออกและเริ่มสร้างใหม่ (ภายใน 5-10%)

มาดูกันว่ามีอะไรอยู่ในระบบจัดเก็บข้อมูลบ้าง

การทดสอบการชนของระบบจัดเก็บข้อมูล AERODISK ENGINE N2 การทดสอบความแข็งแรง

ในสถานะกลุ่มเราเห็นว่ากระบวนการปรับโครงสร้างได้เริ่มต้นขึ้นแล้วและใกล้จะเสร็จสมบูรณ์แล้ว

การทดสอบการชนของระบบจัดเก็บข้อมูล AERODISK ENGINE N2 การทดสอบความแข็งแรง

ในโครงกระดูก RDG คุณจะเห็นว่าดิสก์ 2 แผ่นอยู่ในสถานะสีแดง และดิสก์หนึ่งถูกแทนที่แล้ว ดิสก์แทนที่อัตโนมัติไม่อยู่ที่นั่นอีกต่อไป โดยแทนที่ดิสก์ที่ล้มเหลวตัวที่ 3 การสร้างใหม่ใช้เวลาหลายนาที การเขียนไฟล์เมื่อดิสก์ 3 ตัวล้มเหลวไม่ถูกขัดจังหวะ และประสิทธิภาพ I/O ก็ไม่เปลี่ยนแปลงมากนัก

การทดสอบการชนของระบบจัดเก็บข้อมูล AERODISK ENGINE N2 การทดสอบความแข็งแรง

การทดสอบการชนของระบบจัดเก็บข้อมูล AERODISK ENGINE N2 การทดสอบความแข็งแรง

การทดสอบความล้มเหลวของดิสก์ผ่านการทดสอบอย่างแน่นอน ได้สำเร็จ

ข้อสรุป

เมื่อมาถึงจุดนี้ เราจึงตัดสินใจยุติความรุนแรงต่อระบบจัดเก็บข้อมูล สรุป:

  • การตรวจสอบความล้มเหลวของพอร์ต FC - สำเร็จ
  • การตรวจสอบความล้มเหลวของพอร์ต Ethernet - สำเร็จ
  • ตรวจสอบความล้มเหลวของคอนโทรลเลอร์ - สำเร็จ
  • การทดสอบไฟฟ้าขัดข้อง - สำเร็จ
  • ตรวจสอบความล้มเหลวของดิสก์ใน grouppool - สำเร็จ

ไม่มีความล้มเหลวใดที่หยุดการบันทึกหรือทำให้เกิดข้อผิดพลาดในโหลดสังเคราะห์ แน่นอนว่า ประสิทธิภาพได้รับผลกระทบ (และเรารู้วิธีเอาชนะมัน ซึ่งเราจะดำเนินการในไม่ช้า) แต่เนื่องจากเป็นเพียงไม่กี่วินาที จึงค่อนข้างยอมรับได้ สรุป: ความทนทานต่อความเสียหายของส่วนประกอบทั้งหมดของระบบจัดเก็บข้อมูล AERODISK ทำงานในระดับที่ไม่มีจุดเกิดความล้มเหลว

แน่นอนว่าในบทความหนึ่ง เราไม่สามารถทดสอบสถานการณ์ความล้มเหลวทั้งหมดได้ แต่เราพยายามครอบคลุมสถานการณ์ที่ได้รับความนิยมมากที่สุด ดังนั้นโปรดส่งความคิดเห็น ข้อเสนอแนะสำหรับการตีพิมพ์ในอนาคต และแน่นอนว่าคำวิจารณ์ที่เพียงพอ เรายินดีที่จะพูดคุยกัน (หรือดีกว่านั้น มาอบรม ฉันจะทำซ้ำกำหนดการ เผื่อไว้)! จนกว่าจะมีการทดสอบใหม่!

  • Nizhny Novgorod (เปิดแล้ว – คุณสามารถสมัครได้ที่นี่ https://aerodisk.promo/nn/);
    จนถึงวันที่ 16 เมษายน 2019 ท่านสามารถเยี่ยมชมศูนย์ได้ตลอดเวลาทำการ และในวันที่ 16 เมษายน 2019 จะมีการจัดอบรมหลักสูตรใหญ่
  • ครัสโนดาร์ (เปิดเร็วๆ นี้ - คุณสามารถสมัครได้ที่นี่ https://aerodisk.promo/krsnd/ );
    ตั้งแต่วันที่ 9 เมษายน ถึง 25 เมษายน 2019 สามารถเยี่ยมชมศูนย์ได้ทุกเวลาทำการ และในวันที่ 25 เมษายน 2019 จะมีการจัดอบรมหลักสูตรใหญ่
  • Yekaterinburg (เปิดเร็วๆ นี้ ติดตามข้อมูลบนเว็บไซต์ของเราหรือบน Habré);
    พฤษภาคม-มิถุนายน 2019
  • โนโว (ติดตามข้อมูลบนเว็บไซต์ของเราหรือบนHabré)
    ตุลาคม 2019
  • ครัสโนยา (ติดตามข้อมูลบนเว็บไซต์ของเราหรือบนHabré)
    พฤศจิกายน 2019.

ที่มา: will.com

เพิ่มความคิดเห็น