วิธีเลือกที่เก็บของโดยไม่ต้องยิงตัวเองที่เท้า

การแนะนำ

ถึงเวลาซื้อของฝาก. อันไหนควรเอาไปฟังใคร? ผู้ขาย A พูดคุยเกี่ยวกับผู้ขาย B แล้วก็มีผู้รวมระบบ C ซึ่งบอกตรงกันข้ามและให้คำแนะนำผู้ขาย D ในสถานการณ์เช่นนี้ แม้แต่สถาปนิกการจัดเก็บข้อมูลที่มีประสบการณ์ก็ยังหัวหมุน โดยเฉพาะอย่างยิ่งกับผู้ขายรายใหม่ทั้งหมด รวมถึง SDS และไฮเปอร์คอนเวอร์เจนซ์ที่ทันสมัย วันนี้.

แล้วคุณจะเข้าใจได้อย่างไรและไม่กลายเป็นคนโง่? เรา (แอนตันเสมือนจริง อันตัน ซบันคอฟ และ กป Evgeniy Elizarov) เรามาลองพูดถึงเรื่องนี้เป็นภาษารัสเซียธรรมดากัน
บทความนี้มีความคล้ายคลึงกันหลายประการ และจริงๆ แล้วเป็นส่วนขยายของ “การออกแบบศูนย์ข้อมูลเสมือนจริง”ทั้งในด้านการเลือกระบบจัดเก็บข้อมูลและทบทวนเทคโนโลยีการจัดเก็บ เราจะดูทฤษฎีทั่วไปโดยย่อ แต่เราขอแนะนำให้คุณอ่านบทความนี้ด้วย

ทำไม

คุณมักจะเห็นสถานการณ์ที่มีคนใหม่เข้ามาในฟอรัมหรือการแชทพิเศษ เช่น การสนทนาเรื่องพื้นที่เก็บข้อมูล และถามคำถาม: “ที่นี่พวกเขามีตัวเลือกพื้นที่เก็บข้อมูลสองตัวเลือกให้ฉัน - ABC SuperStorage S600 และ XYZ HyperOcean 666v4 คุณจะแนะนำอะไร ?”

และความสับสนเริ่มต้นขึ้นว่าใครมีคุณสมบัติอะไรบ้างในการใช้งานคุณสมบัติที่น่ากลัวและไม่สามารถเข้าใจได้ซึ่งสำหรับคนที่ไม่ได้เตรียมตัวไว้นั้นเป็นภาษาจีนโดยสมบูรณ์

ดังนั้น คำถามสำคัญและคำถามแรกสุดที่คุณต้องถามตัวเองเป็นเวลานานก่อนที่จะเปรียบเทียบข้อกำหนดในข้อเสนอเชิงพาณิชย์คือ เพราะเหตุใด เหตุใดระบบจัดเก็บข้อมูลนี้จึงจำเป็น?

วิธีเลือกที่เก็บของโดยไม่ต้องยิงตัวเองที่เท้า

คำตอบจะเป็นสิ่งที่ไม่คาดคิดและเป็นสไตล์ของ Tony Robbins ในการจัดเก็บข้อมูล ขอบคุณกัปตัน! แต่บางครั้งเราก็เจาะลึกในการเปรียบเทียบรายละเอียดจนลืมไปว่าเหตุใดเราจึงทำทั้งหมดนี้ตั้งแต่แรก

ดังนั้นหน้าที่ของระบบจัดเก็บข้อมูลคือการจัดเก็บและให้การเข้าถึงข้อมูลด้วยประสิทธิภาพที่กำหนด เราจะเริ่มต้นด้วยข้อมูล

ข้อมูล

ชนิดข้อมูล

เราวางแผนที่จะจัดเก็บข้อมูลประเภทใด? คำถามสำคัญมากที่สามารถขจัดระบบจัดเก็บข้อมูลจำนวนมากออกจากการพิจารณาได้ ตัวอย่างเช่น คุณวางแผนที่จะจัดเก็บวิดีโอและภาพถ่าย คุณสามารถขีดฆ่าระบบที่ออกแบบมาเพื่อการเข้าถึงแบบสุ่มในบล็อกขนาดเล็กหรือระบบที่มีคุณสมบัติเฉพาะในการบีบอัด / การขจัดข้อมูลซ้ำซ้อนได้ทันที สิ่งเหล่านี้อาจเป็นระบบที่ยอดเยี่ยม เราไม่ต้องการพูดอะไรที่ไม่ดี แต่ในกรณีนี้จุดแข็งของพวกเขาอาจจะอ่อนแอ (วิดีโอและภาพถ่ายไม่ถูกบีบอัด) หรือทำให้ต้นทุนของระบบเพิ่มขึ้นอย่างมาก

ในทางกลับกัน หากจุดประสงค์การใช้งานคือ DBMS ที่ทำธุรกรรมไม่ว่าง ระบบสตรีมมิ่งมัลติมีเดียที่ยอดเยี่ยมที่มีความสามารถในการส่งกิกะไบต์ต่อวินาทีจะเป็นตัวเลือกที่ไม่ดี

ปริมาณข้อมูล

เราวางแผนที่จะจัดเก็บข้อมูลจำนวนเท่าใด? ปริมาณพัฒนาไปสู่คุณภาพเสมอ ซึ่งไม่ควรลืม โดยเฉพาะอย่างยิ่งในช่วงเวลาที่ปริมาณข้อมูลเติบโตแบบทวีคูณ ระบบระดับเพตาไบต์ไม่ใช่เรื่องแปลกอีกต่อไป แต่ยิ่งความจุเพตาไบต์มากขึ้น ระบบก็จะมีความเฉพาะเจาะจงมากขึ้นเท่านั้น ฟังก์ชันปกติของระบบเข้าถึงแบบสุ่มขนาดเล็กและขนาดกลางก็จะเข้าถึงได้น้อยลง เป็นเรื่องเล็กน้อยเนื่องจากตารางสถิติการเข้าถึงบล็อกเพียงอย่างเดียวจะมีขนาดใหญ่กว่าจำนวน RAM ที่มีอยู่ในคอนโทรลเลอร์ ไม่ต้องพูดถึงการบีบอัด/การจัดระดับ สมมติว่าเราต้องการเปลี่ยนอัลกอริธึมการบีบอัดให้เป็นอัลกอริธึมที่มีประสิทธิภาพมากขึ้นและบีบอัดข้อมูล 20 เพตาไบต์ จะใช้เวลานานแค่ไหน: หกเดือนหนึ่งปี?

ในทางกลับกัน ทำไมต้องกังวลถ้าคุณต้องการจัดเก็บและประมวลผลข้อมูลขนาด 500 GB? เพียง 500 SSD สำหรับครัวเรือน (ที่มี DWPD ต่ำ) ขนาดนี้ไม่มีค่าใช้จ่าย เหตุใดจึงต้องสร้างโรงงาน Fibre Channel และซื้อระบบจัดเก็บข้อมูลภายนอกระดับไฮเอนด์ที่มีราคาเทียบเท่ากับสะพานเหล็กหล่อ

ข้อมูลยอดนิยมมีกี่เปอร์เซ็นต์ของทั้งหมด โหลดในแง่ของปริมาณข้อมูลไม่เท่ากันมากน้อยเพียงใด นี่คือจุดที่เทคโนโลยีการจัดเก็บข้อมูลแบบแบ่งชั้นหรือ Flash Cache มีประโยชน์มากหากปริมาณข้อมูลร้อนมีน้อยเมื่อเทียบกับข้อมูลทั้งหมด หรือในทางกลับกัน ด้วยการโหลดที่สม่ำเสมอตลอดทั้งวอลุ่ม ซึ่งมักพบในระบบสตรีมมิ่ง (กล้องวงจรปิด ระบบวิเคราะห์บางระบบ) เทคโนโลยีดังกล่าวจะไม่ให้อะไรเลยและจะเพิ่มต้นทุน/ความซับซ้อนของระบบเท่านั้น

IP

อีกด้านของข้อมูลคือระบบสารสนเทศที่ใช้ข้อมูล IS มีข้อกำหนดชุดหนึ่งที่สืบทอดข้อมูล สำหรับข้อมูลเพิ่มเติมเกี่ยวกับ IS โปรดดูที่ “การออกแบบศูนย์ข้อมูลเสมือนจริง”

ข้อกำหนดด้านความยืดหยุ่น/ความพร้อมใช้งาน

ข้อกำหนดสำหรับความทนทานต่อข้อผิดพลาด/ความพร้อมของข้อมูลนั้นสืบทอดมาจาก IS ที่ใช้งานและแสดงเป็นตัวเลขสามตัว - RPO, RTO, ความพร้อมใช้งาน.

ความพร้อมใช้งาน — การแบ่งปันในช่วงเวลาที่กำหนดในระหว่างที่มีข้อมูลสำหรับการทำงานกับพวกเขา โดยปกติจะแสดงเป็นตัวเลข 9 ตัวอย่างเช่น เก้าเก้าครั้งต่อปีหมายความว่ามีความพร้อมใช้งานอยู่ที่ 99% หรือมิฉะนั้น อนุญาตให้มีเวลาว่างได้ 95 ชั่วโมงต่อปี สามเก้า - 9,5 ชั่วโมงต่อปี

RPO / RTO ไม่ใช่ตัวบ่งชี้ทั้งหมด แต่สำหรับแต่ละเหตุการณ์ (อุบัติเหตุ) ซึ่งตรงกันข้ามกับความพร้อมใช้งาน

RPO — จำนวนข้อมูลที่สูญหายระหว่างเกิดอุบัติเหตุ (เป็นชั่วโมง) ตัวอย่างเช่น หากการสำรองข้อมูลเกิดขึ้นวันละครั้ง RPO = 24 ชั่วโมง เหล่านั้น. ในกรณีที่เกิดภัยพิบัติและสูญเสียระบบจัดเก็บข้อมูลโดยสิ้นเชิง ข้อมูลอาจสูญหายได้นานถึง 24 ชั่วโมง (นับจากช่วงเวลาที่สำรองข้อมูล) ตาม RPO ที่ระบุไว้สำหรับ IS เป็นต้น มีการเขียนกฎระเบียบสำรองไว้ นอกจากนี้ จาก RPO คุณสามารถเข้าใจได้ว่าจำเป็นต้องมีการจำลองข้อมูลแบบซิงโครนัส/อะซิงโครนัสมากน้อยเพียงใด

RTO — เวลาในการฟื้นฟูบริการ (การเข้าถึงข้อมูล) หลังเกิดภัยพิบัติ จากค่า RTO ที่กำหนด เราสามารถเข้าใจได้ว่าจำเป็นต้องใช้คลัสเตอร์เมโทรหรือไม่ หรือการจำลองแบบทิศทางเดียวนั้นเพียงพอหรือไม่ คุณต้องการระบบจัดเก็บข้อมูลแบบหลายคอนโทรลเลอร์ระดับไฮเอนด์หรือไม่?

วิธีเลือกที่เก็บของโดยไม่ต้องยิงตัวเองที่เท้า

ต้องการประสิทธิภาพการทำงาน

แม้ว่านี่จะเป็นคำถามที่ชัดเจนมาก แต่ปัญหาส่วนใหญ่ก็เกิดขึ้นที่นี่ ขึ้นอยู่กับว่าคุณมีโครงสร้างพื้นฐานบางประเภทอยู่แล้วหรือไม่ วิธีรวบรวมสถิติที่จำเป็นจะถูกสร้างขึ้น

คุณมีระบบจัดเก็บข้อมูลอยู่แล้วและกำลังมองหาอุปกรณ์ทดแทนหรือต้องการซื้อระบบอื่นเพื่อขยาย ทุกอย่างเรียบง่ายที่นี่ คุณเข้าใจว่าคุณมีบริการใดบ้างและคุณวางแผนที่จะนำไปใช้ในอนาคตอันใกล้นี้ จากบริการในปัจจุบัน คุณมีโอกาสที่จะรวบรวมสถิติประสิทธิภาพ ตัดสินใจเกี่ยวกับจำนวน IOPS และเวลาแฝงปัจจุบัน - อะไรคือตัวบ่งชี้เหล่านี้และเพียงพอสำหรับงานของคุณ? ซึ่งสามารถทำได้ทั้งบนระบบจัดเก็บข้อมูลและจากโฮสต์ที่เชื่อมต่ออยู่

ยิ่งไปกว่านั้น คุณต้องไม่เพียงแค่ดูที่โหลดปัจจุบันเท่านั้น แต่ยังต้องดูในช่วงเวลาหนึ่งด้วย (ควรเป็นหนึ่งเดือน) ดูว่าจุดสูงสุดสูงสุดระหว่างวันคือเท่าใด โหลดใดที่การสำรองข้อมูลสร้างขึ้น ฯลฯ หากระบบจัดเก็บข้อมูลหรือซอฟต์แวร์ของคุณไม่ได้ให้ข้อมูลชุดนี้แก่คุณ คุณสามารถใช้เครื่องมือ RRD ฟรี ซึ่งสามารถทำงานร่วมกับระบบจัดเก็บข้อมูลและสวิตช์ยอดนิยมส่วนใหญ่ และสามารถให้สถิติประสิทธิภาพโดยละเอียดแก่คุณได้ นอกจากนี้ยังควรพิจารณาโหลดบนโฮสต์ที่ทำงานร่วมกับระบบจัดเก็บข้อมูลนี้ สำหรับเครื่องเสมือนเฉพาะ หรือสิ่งที่กำลังทำงานบนโฮสต์นี้

วิธีเลือกที่เก็บของโดยไม่ต้องยิงตัวเองที่เท้า

เป็นที่น่าสังเกตว่าหากความล่าช้าของโวลุ่มและที่เก็บข้อมูลที่อยู่ในโวลุ่มนี้แตกต่างกันค่อนข้างมากคุณควรให้ความสนใจกับเครือข่าย SAN ของคุณ มีความเป็นไปได้สูงที่จะเกิดปัญหากับมันและก่อนที่จะซื้อใหม่ ระบบ ก็คุ้มค่าที่จะพิจารณาปัญหานี้ เนื่องจากมีความเป็นไปได้สูงมากที่จะเพิ่มประสิทธิภาพของระบบปัจจุบัน

คุณกำลังสร้างโครงสร้างพื้นฐานตั้งแต่เริ่มต้น หรือซื้อระบบสำหรับบริการใหม่บางอย่าง ซึ่งมีภาระมากมายที่คุณไม่ทราบ มีหลายทางเลือก: สื่อสารกับเพื่อนร่วมงานเกี่ยวกับแหล่งข้อมูลเฉพาะทางเพื่อพยายามค้นหาและคาดการณ์ปริมาณงาน ติดต่อผู้ประกอบระบบที่มีประสบการณ์ในการใช้บริการที่คล้ายกัน และผู้ที่สามารถคำนวณปริมาณงานให้กับคุณได้ และตัวเลือกที่สาม (โดยปกติแล้วจะยากที่สุด โดยเฉพาะอย่างยิ่งหากเกี่ยวข้องกับแอปพลิเคชันที่เขียนเองที่บ้านหรือแอปพลิเคชันที่หายาก) คือการพยายามค้นหาข้อกำหนดด้านประสิทธิภาพจากนักพัฒนาระบบ

และโปรดทราบว่า ตัวเลือกที่ถูกต้องที่สุดจากมุมมองของการใช้งานจริงคือการนำร่องกับอุปกรณ์ปัจจุบัน หรืออุปกรณ์ที่จัดเตรียมไว้สำหรับการทดสอบโดยผู้จำหน่าย/ผู้ประกอบ

ความต้องการพิเศษ

ข้อกำหนดพิเศษคือทุกสิ่งที่ไม่อยู่ภายใต้ข้อกำหนดด้านประสิทธิภาพ ความทนทานต่อข้อผิดพลาด และฟังก์ชันการทำงานสำหรับการประมวลผลโดยตรงและการจัดเตรียมข้อมูล

ข้อกำหนดพิเศษที่ง่ายที่สุดประการหนึ่งสำหรับระบบจัดเก็บข้อมูลสามารถเรียกได้ว่าเป็น "สื่อจัดเก็บข้อมูลที่สามารถแยกออกได้" และชัดเจนทันทีว่าระบบจัดเก็บข้อมูลนี้ต้องมีไลบรารีเทปหรือเพียงเทปไดรฟ์ที่จะทิ้งสำเนาสำรองไว้ หลังจากนั้นผู้ที่ได้รับการฝึกอบรมมาเป็นพิเศษจะลงนามในเทปและนำไปที่ตู้นิรภัยพิเศษอย่างภาคภูมิใจ
อีกตัวอย่างหนึ่งของข้อกำหนดพิเศษคือการออกแบบกันกระแทกที่ได้รับการป้องกัน

ที่ไหน

องค์ประกอบหลักที่สองในการเลือกระบบจัดเก็บข้อมูลเฉพาะคือข้อมูลเกี่ยวกับตำแหน่งของระบบจัดเก็บข้อมูลนี้ เริ่มต้นจากภูมิศาสตร์หรือสภาพภูมิอากาศและสิ้นสุดที่บุคลากร

ลูกค้า

ระบบจัดเก็บข้อมูลนี้มีการวางแผนเพื่อใคร? คำถามมีเหตุผลดังต่อไปนี้:

ลูกค้าภาครัฐ/เชิงพาณิชย์
ลูกค้าเชิงพาณิชย์ไม่มีข้อจำกัดและไม่จำเป็นต้องถือประกวดราคา ยกเว้นตามข้อบังคับภายในของลูกค้าเอง

ลูกค้าภาครัฐเป็นอีกเรื่องหนึ่ง 44 กฎหมายของรัฐบาลกลางและความพึงพอใจอื่น ๆ ที่มีการประมูลและข้อกำหนดทางเทคนิคที่สามารถท้าทายได้

ลูกค้าอยู่ภายใต้การลงโทษ
คำถามนี้ง่ายมาก - ตัวเลือกนั้นถูกจำกัดโดยข้อเสนอที่มีให้สำหรับลูกค้าที่กำหนดเท่านั้น

กฎระเบียบภายใน / ผู้จำหน่าย / รุ่นที่ได้รับอนุญาตให้ซื้อ
คำถามนั้นง่ายมาก แต่คุณต้องจำไว้

ทางร่างกายที่ไหน.

ในส่วนนี้เราจะพิจารณาปัญหาทั้งหมดเกี่ยวกับภูมิศาสตร์ ช่องทางการสื่อสาร และปากน้ำในบริเวณที่พัก

บุคลากร

ใครจะทำงานร่วมกับระบบจัดเก็บข้อมูลนี้? สิ่งนี้มีความสำคัญไม่น้อยไปกว่าสิ่งที่ระบบจัดเก็บข้อมูลสามารถทำได้
ไม่ว่าระบบจัดเก็บข้อมูลจากผู้ขาย A จะมีแนวโน้ม เจ๋ง และยอดเยี่ยมเพียงใด ก็อาจมีจุดเล็กๆ น้อยๆ ในการติดตั้งหากพนักงานรู้วิธีทำงานร่วมกับผู้จำหน่าย B เท่านั้น และไม่มีแผนสำหรับการซื้อเพิ่มเติมและความร่วมมืออย่างต่อเนื่องกับ A

และแน่นอนว่า อีกด้านของคำถามคือบุคลากรที่ได้รับการฝึกอบรมที่มีอยู่ในสถานที่ตั้งทางภูมิศาสตร์ที่กำหนดโดยตรงในบริษัทและอาจอยู่ในตลาดแรงงานได้อย่างไร สำหรับภูมิภาค การเลือกระบบจัดเก็บข้อมูลที่มีอินเทอร์เฟซที่เรียบง่ายหรือความสามารถในการรวมการจัดการจากระยะไกลอาจเป็นเรื่องที่สมเหตุสมผล มิฉะนั้น เมื่อถึงจุดหนึ่ง มันอาจจะเจ็บปวดแสนสาหัส อินเทอร์เน็ตเต็มไปด้วยเรื่องราวว่าพนักงานใหม่ที่มาถึงซึ่งเป็นนักเรียนเมื่อวานนี้ กำหนดค่าดังกล่าวจนทั้งสำนักงานถูกฆ่าตายได้อย่างไร

วิธีเลือกที่เก็บของโดยไม่ต้องยิงตัวเองที่เท้า

สิ่งแวดล้อม

และแน่นอนว่าคำถามสำคัญก็คือระบบจัดเก็บข้อมูลนี้จะทำงานในสภาพแวดล้อมใด

  • แล้วแหล่งจ่ายไฟ/ความเย็นล่ะ?
  • การเชื่อมต่ออะไร
  • จะติดตั้งได้ที่ไหน?
  • และอื่น ๆ

บ่อยครั้งที่คำถามเหล่านี้มักถูกมองข้ามและไม่ได้พิจารณาเป็นพิเศษ แต่บางครั้งคำถามเหล่านี้ก็สามารถพลิกสถานการณ์ได้

ที่

ผู้ขาย

ณ วันนี้ (กลางปี ​​2019) ตลาดการจัดเก็บข้อมูลของรัสเซียสามารถแบ่งออกเป็น 5 ประเภท:

  1. แผนกที่สูงที่สุดคือบริษัทที่มีชื่อเสียงซึ่งมีชั้นวางดิสก์หลากหลายตั้งแต่ระดับง่ายที่สุดไปจนถึงระดับสูง (HPE, DellEMC, Hitachi, NetApp, IBM / Lenovo)
  2. แผนกที่สอง - บริษัทที่มีสายการผลิตจำกัด ผู้เล่นเฉพาะกลุ่ม ผู้จำหน่าย SDS อย่างจริงจัง หรือบริษัทหน้าใหม่ที่กำลังเติบโต (Fujitsu, Datacore, Infinidat, Huawei, Pure ฯลฯ)
  3. แผนกที่สาม - โซลูชันเฉพาะกลุ่มในระดับล่าง, SDS ราคาถูก, ผลิตภัณฑ์ขั้นสูงตาม ceph และโครงการเปิดอื่นๆ (Infortrend, Starwind ฯลฯ)
  4. ส่วน SOHO - ระบบจัดเก็บข้อมูลขนาดเล็กและขนาดเล็กพิเศษสำหรับระดับบ้าน/สำนักงานขนาดเล็ก (Synology, QNAP ฯลฯ)
  5. ระบบจัดเก็บข้อมูลทดแทนการนำเข้า - รวมถึงทั้งฮาร์ดแวร์ของแผนกแรกที่มีป้ายกำกับใหม่ และตัวแทนที่หายากของหน่วยที่สอง (RAIDIX เราจะให้ส่วนที่สองล่วงหน้า) แต่ส่วนใหญ่เป็นแผนกที่สาม (Aerodisk บอม, ดีโป ฯลฯ)

การแบ่งค่อนข้างจะเป็นไปตามอำเภอใจ และไม่ได้หมายความว่าส่วนที่สามหรือ SOHO ไม่ดีและไม่สามารถใช้งานได้เลย ในโครงการเฉพาะที่มีชุดข้อมูลและโปรไฟล์โหลดที่กำหนดไว้อย่างชัดเจน พวกเขาสามารถทำงานได้ดีมาก เหนือกว่าแผนกแรกในแง่ของอัตราส่วนราคา/คุณภาพ สิ่งสำคัญคือต้องตัดสินใจเกี่ยวกับเป้าหมาย โอกาสในการเติบโต และฟังก์ชันการทำงานที่จำเป็นก่อน จากนั้น Synology จะให้บริการคุณอย่างซื่อสัตย์ และเส้นผมของคุณจะนุ่มสลวย

ปัจจัยสำคัญประการหนึ่งเมื่อเลือกผู้จัดจำหน่ายคือสภาพแวดล้อมในปัจจุบัน คุณมีระบบจัดเก็บข้อมูลจำนวนกี่ระบบและระบบจัดเก็บข้อมูลใดที่วิศวกรของคุณสามารถใช้งานได้ คุณต้องการผู้จำหน่ายรายอื่นหรือจุดติดต่ออื่นหรือไม่ คุณจะค่อยๆ ย้ายโหลดทั้งหมดจากผู้ขาย A ไปยังผู้จำหน่าย B หรือไม่

เราไม่ควรสร้างสิ่งที่เกินความจำเป็น

iSCSI/FC/File

ไม่มีความเห็นพ้องต้องกันในหมู่วิศวกรเกี่ยวกับประเด็นของโปรโตคอลการเข้าถึง และการอภิปรายนั้นคล้ายคลึงกับการอภิปรายทางเทววิทยามากกว่าการอภิปรายทางวิศวกรรม แต่โดยทั่วไปสามารถสังเกตประเด็นต่อไปนี้ได้:

เอฟซีโออี ตายมากกว่ามีชีวิตอยู่

เอฟซี vs ไอเอสซีไอ. ข้อได้เปรียบที่สำคัญประการหนึ่งของ FC ในปี 2019 ในด้านพื้นที่จัดเก็บ IP ซึ่งเป็นโรงงานเฉพาะสำหรับการเข้าถึงข้อมูล ได้รับการชดเชยด้วยเครือข่าย IP เฉพาะ FC ไม่มีข้อได้เปรียบระดับโลกเหนือเครือข่าย IP และ IP สามารถใช้เพื่อสร้างระบบจัดเก็บข้อมูลของโหลดระดับใดก็ได้ จนถึงระบบสำหรับ DBMS หนักสำหรับระบบธนาคารหลักของธนาคารขนาดใหญ่ ในทางกลับกัน การตายของ FC ได้รับการพยากรณ์มาหลายปีแล้ว แต่มีบางอย่างที่ขัดขวางอยู่ตลอดเวลา ตัวอย่างเช่น ปัจจุบัน ผู้เล่นบางรายในตลาดอุปกรณ์จัดเก็บข้อมูลกำลังพัฒนามาตรฐาน NVMEoF อย่างแข็งขัน ไม่ว่าเขาจะแบ่งปันชะตากรรมของ FCoE หรือไม่ - เวลาจะบอก

การเข้าถึงไฟล์ ไม่ใช่สิ่งที่ไม่สมควรได้รับความสนใจเช่นกัน NFS/CIFS ทำงานได้ดีในสภาพแวดล้อมการผลิต และหากออกแบบอย่างถูกต้อง ก็จะไม่มีปัญหาใดๆ มากไปกว่าโปรโตคอลแบบบล็อก

ไฮบริด / อาร์เรย์แฟลชทั้งหมด

ระบบจัดเก็บข้อมูลแบบคลาสสิกมี 2 ประเภท:

  1. AFA (All Flash Array) - ระบบที่ปรับให้เหมาะกับการใช้งาน SSD
  2. ไฮบริด - อนุญาตให้คุณใช้ทั้ง HDD และ SSD หรือทั้งสองอย่างรวมกัน

ความแตกต่างที่สำคัญคือเทคโนโลยีประสิทธิภาพการจัดเก็บข้อมูลที่รองรับและระดับประสิทธิภาพสูงสุด (IOPS สูงและเวลาแฝงต่ำ) ทั้งสองระบบ (ในรุ่นส่วนใหญ่ ไม่นับกลุ่มระดับล่าง) สามารถทำงานเป็นทั้งอุปกรณ์บล็อกและอุปกรณ์ไฟล์ ฟังก์ชั่นที่รองรับขึ้นอยู่กับระดับของระบบ และสำหรับรุ่นที่อายุน้อยกว่านั้นมักจะถูกลดระดับให้เหลือน้อยที่สุด สิ่งนี้ควรค่าแก่การใส่ใจเมื่อคุณศึกษาลักษณะของรุ่นใดรุ่นหนึ่งและไม่ใช่แค่ความสามารถของสายทั้งหมดโดยรวม นอกจากนี้ แน่นอนว่าคุณลักษณะทางเทคนิค เช่น โปรเซสเซอร์ จำนวนหน่วยความจำ แคช จำนวนและประเภทของพอร์ต ฯลฯ ก็ขึ้นอยู่กับระดับของระบบด้วย จากมุมมองด้านการจัดการ AFA แตกต่างจากระบบไฮบริด (ดิสก์) เฉพาะในการใช้กลไกสำหรับการทำงานกับไดรฟ์ SSD และแม้ว่าคุณจะใช้ SSD ในระบบไฮบริด แต่ก็ไม่ได้หมายความว่าคุณจะสามารถทำได้เลย เพื่อให้บรรลุถึงระดับประสิทธิภาพในระดับของระบบ AFA นอกจากนี้ ในกรณีส่วนใหญ่ กลไกการจัดเก็บข้อมูลที่มีประสิทธิภาพแบบอินไลน์จะถูกปิดใช้งานบนระบบไฮบริด และการรวมกลไกดังกล่าวจะทำให้ประสิทธิภาพลดลง

ระบบจัดเก็บข้อมูลพิเศษ

นอกเหนือจากระบบจัดเก็บข้อมูลเอนกประสงค์ที่เน้นไปที่การประมวลผลข้อมูลการดำเนินงานเป็นหลักแล้ว ยังมีระบบจัดเก็บข้อมูลพิเศษที่มีหลักการสำคัญที่แตกต่างจากหลักการทั่วไปโดยพื้นฐาน (เวลาแฝงต่ำ, IOPS สูง):

สื่อ.

ระบบเหล่านี้ได้รับการออกแบบมาเพื่อจัดเก็บและประมวลผลไฟล์มีเดียขนาดใหญ่ ตอบกลับ ความล่าช้านั้นไม่สำคัญในทางปฏิบัติ และความสามารถในการส่งและรับข้อมูลในย่านความถี่กว้างในสตรีมคู่ขนานหลาย ๆ สิ่งสำคัญคือสิ่งสำคัญที่สุด

ขจัดข้อมูลซ้ำซ้อนของระบบจัดเก็บข้อมูลสำหรับการสำรองข้อมูล

เนื่องจากสำเนาสำรองมีความคล้ายคลึงกันซึ่งหาได้ยากภายใต้สภาวะปกติ (สำเนาสำรองโดยเฉลี่ยแตกต่างจากสำเนาเมื่อวาน 1-2%) ระบบระดับนี้จึงจัดแพคเกจข้อมูลที่บันทึกไว้ในขนาดค่อนข้างเล็กได้อย่างมีประสิทธิภาพอย่างยิ่ง จำนวนสื่อทางกายภาพ ตัวอย่างเช่น ในบางกรณี อัตราการบีบอัดข้อมูลอาจสูงถึง 200 ต่อ 1

ระบบจัดเก็บวัตถุ

ระบบจัดเก็บข้อมูลเหล่านี้ไม่มีวอลลุ่มการเข้าถึงแบบบล็อกและการแชร์ไฟล์ตามปกติ และที่สำคัญที่สุดคือระบบเหล่านี้มีลักษณะคล้ายกับฐานข้อมูลขนาดใหญ่ การเข้าถึงออบเจ็กต์ที่จัดเก็บไว้ในระบบดังกล่าวจะดำเนินการโดยตัวระบุเฉพาะหรือโดยข้อมูลเมตา (เช่น ออบเจ็กต์รูปแบบ JPEG ทั้งหมดที่มีวันที่สร้างระหว่าง XX-XX-XXXX และ YY-YY-YYYY)

ระบบการปฏิบัติตาม.

ทุกวันนี้มันไม่ธรรมดาในรัสเซีย แต่ก็ควรค่าแก่การกล่าวถึง วัตถุประสงค์ของระบบจัดเก็บข้อมูลดังกล่าวคือการรับประกันการจัดเก็บข้อมูลเพื่อให้สอดคล้องกับนโยบายความปลอดภัยหรือข้อกำหนดด้านกฎระเบียบ บางระบบ (เช่น EMC Centera) ได้ใช้ฟังก์ชันห้ามการลบข้อมูล - ทันทีที่บิดกุญแจและระบบเข้าสู่โหมดนี้ ทั้งผู้ดูแลระบบหรือบุคคลอื่นไม่สามารถลบข้อมูลที่บันทึกไว้แล้วได้ทางกายภาพ

เทคโนโลยีที่เป็นกรรมสิทธิ์

แคชแฟลช

Flash Cache เป็นชื่อทั่วไปสำหรับเทคโนโลยีที่เป็นกรรมสิทธิ์ทั้งหมดสำหรับการใช้หน่วยความจำแฟลชเป็นแคชระดับที่สอง เมื่อใช้แฟลชแคช โดยปกติระบบจัดเก็บข้อมูลจะถูกคำนวณเพื่อให้มีการโหลดที่สม่ำเสมอจากดิสก์แม่เหล็ก ในขณะที่แคชจะเสิร์ฟจุดสูงสุด

ในกรณีนี้ จำเป็นต้องเข้าใจโปรไฟล์โหลดและระดับของการแปลการเข้าถึงบล็อกของปริมาณการจัดเก็บข้อมูล แคชแฟลชเป็นเทคโนโลยีสำหรับปริมาณงานที่มีการสืบค้นที่มีการแปลเป็นภาษาท้องถิ่นสูง และในทางปฏิบัติไม่สามารถใช้ได้กับปริมาณโหลดที่สม่ำเสมอ (เช่น สำหรับระบบการวิเคราะห์)

มีการใช้งานแคชแฟลชสองแบบที่มีอยู่ในตลาด:

  • อ่านเท่านั้น. ในกรณีนี้ เฉพาะข้อมูลที่อ่านเท่านั้นที่จะถูกแคช และการเขียนจะไปที่ดิสก์โดยตรง ผู้ผลิตบางราย เช่น NetApp เชื่อว่าการเขียนลงระบบจัดเก็บข้อมูลของตนนั้นเหมาะสมที่สุดแล้ว และแคชจะไม่ช่วยอะไรเลย
  • อ่านเขียน. ไม่เพียงแต่การอ่านเท่านั้น แต่ยังแคชการเขียนอีกด้วย ซึ่งช่วยให้คุณสามารถบัฟเฟอร์สตรีมและลดผลกระทบของการลงโทษ RAID และเป็นผลให้ประสิทธิภาพโดยรวมเพิ่มขึ้นสำหรับระบบจัดเก็บข้อมูลที่มีกลไกการเขียนที่เหมาะสมที่สุดน้อยลง

การจัดระดับ

อุปกรณ์จัดเก็บข้อมูลหลายระดับ (การเหนื่อย) เป็นเทคโนโลยีสำหรับการรวมระดับที่มีระดับประสิทธิภาพที่แตกต่างกัน เช่น SSD และ HDD ลงในดิสก์พูลเดียว ในกรณีที่การเข้าถึงบล็อกข้อมูลมีความไม่สม่ำเสมออย่างเด่นชัด ระบบจะสามารถสร้างสมดุลของบล็อกข้อมูลโดยอัตโนมัติ ย้ายบล็อกที่โหลดไปยังระดับประสิทธิภาพสูง และในทางกลับกันไปที่บล็อกที่เย็นกว่า

ระบบไฮบริดของชนชั้นล่างและชนชั้นกลางใช้พื้นที่จัดเก็บข้อมูลหลายระดับโดยมีข้อมูลที่เคลื่อนย้ายระหว่างระดับต่างๆ ตามกำหนดเวลา ในเวลาเดียวกันขนาดของบล็อกการจัดเก็บข้อมูลหลายระดับสำหรับรุ่นที่ดีที่สุดคือ 256 MB คุณสมบัติเหล่านี้ไม่อนุญาตให้เราถือว่าเทคโนโลยีการจัดเก็บข้อมูลแบบแบ่งชั้นเป็นเทคโนโลยีเพื่อเพิ่มผลผลิต ดังที่หลายคนเชื่อผิด พื้นที่จัดเก็บข้อมูลหลายระดับในระบบระดับล่างและระดับกลางเป็นเทคโนโลยีสำหรับการปรับต้นทุนการจัดเก็บข้อมูลให้เหมาะสมสำหรับระบบที่มีโหลดไม่สม่ำเสมออย่างเห็นได้ชัด

ภาพย่อ

ไม่ว่าเราจะพูดถึงความน่าเชื่อถือของระบบจัดเก็บข้อมูลมากแค่ไหน ก็มีโอกาสมากมายที่จะสูญเสียข้อมูลที่ไม่ได้ขึ้นอยู่กับปัญหาฮาร์ดแวร์ นี่อาจเป็นไวรัส แฮกเกอร์ หรือการลบ/ความเสียหายของข้อมูลโดยไม่ได้ตั้งใจ ด้วยเหตุนี้ การสำรองข้อมูลการผลิตจึงเป็นส่วนสำคัญของงานวิศวกร

สแน็ปช็อตคือสแน็ปช็อตของวอลุ่ม ณ จุดใดเวลาหนึ่ง เมื่อทำงานกับระบบส่วนใหญ่ เช่น เวอร์ชวลไลเซชั่น ฐานข้อมูล ฯลฯ เราจำเป็นต้องใช้สแน็ปช็อตเพื่อคัดลอกข้อมูลไปยังสำเนาสำรอง ในขณะที่ IS ของเราจะสามารถทำงานกับวอลุ่มนี้ต่อไปได้อย่างปลอดภัย แต่ก็ควรจำไว้ว่าไม่ใช่ว่าสแนปช็อตทั้งหมดจะมีประโยชน์เท่ากัน ผู้จำหน่ายแต่ละรายมีแนวทางในการสร้างสแน็ปช็อตที่เกี่ยวข้องกับสถาปัตยกรรมที่แตกต่างกัน

CoW (คัดลอกเมื่อเขียน). เมื่อคุณพยายามเขียนบล็อคข้อมูล เนื้อหาต้นฉบับจะถูกคัดลอกไปยังพื้นที่พิเศษ หลังจากนั้นการเขียนจะดำเนินการตามปกติ วิธีนี้จะช่วยป้องกันข้อมูลเสียหายภายในสแน็ปช็อต โดยปกติแล้ว การจัดการข้อมูล "ปรสิต" เหล่านี้ทำให้เกิดภาระเพิ่มเติมบนระบบจัดเก็บข้อมูล และด้วยเหตุนี้ ผู้จำหน่ายที่มีการใช้งานคล้ายกันจึงไม่แนะนำให้ใช้สแน็ปช็อตมากกว่าหนึ่งโหล และอย่าใช้สแน็ปช็อตเลยในปริมาณที่มีการโหลดสูง

RoW (เปลี่ยนเส้นทางเมื่อเขียน). ในกรณีนี้ โวลุ่มต้นฉบับค้างตามธรรมชาติ และเมื่อพยายามเขียนบล็อกข้อมูล ระบบจัดเก็บข้อมูลจะเขียนข้อมูลไปยังพื้นที่พิเศษในพื้นที่ว่าง โดยเปลี่ยนตำแหน่งของบล็อกนี้ในตารางข้อมูลเมตา วิธีนี้ช่วยให้คุณลดจำนวนการดำเนินการเขียนซ้ำได้ ซึ่งท้ายที่สุดจะกำจัดประสิทธิภาพที่ลดลงและลบข้อจำกัดเกี่ยวกับสแน็ปช็อตและหมายเลขของสแน็ปช็อต

สแนปชอตยังมีสองประเภทที่เกี่ยวข้องกับแอปพลิเคชัน:

ความสม่ำเสมอของการสมัคร. ในขณะที่สร้างสแน็ปช็อต ระบบจัดเก็บข้อมูลจะดึงเอเจนต์ในระบบปฏิบัติการของผู้ใช้บริการ ซึ่งจะบังคับให้ล้างดิสก์แคชจากหน่วยความจำไปยังดิสก์ และบังคับให้แอปพลิเคชันทำเช่นนี้ ในกรณีนี้ เมื่อกู้คืนจากสแน็ปช็อต ข้อมูลจะมีความสอดคล้องกัน

ความผิดพลาดที่สอดคล้องกัน. ในกรณีนี้ จะไม่มีอะไรเกิดขึ้นและมีการสร้างสแนปชอตตามที่เป็นอยู่ ในกรณีของการกู้คืนจากสแน็ปช็อตดังกล่าว รูปภาพจะเหมือนกับสิ่งที่จะเกิดขึ้นหากไฟฟ้าดับกะทันหันและข้อมูลบางส่วนอาจสูญหาย ติดอยู่ในแคชและไม่สามารถเข้าถึงดิสก์ได้ สแน็ปช็อตดังกล่าวใช้งานได้ง่ายกว่าและไม่ทำให้ประสิทธิภาพในแอปพลิเคชันลดลง แต่มีความน่าเชื่อถือน้อยกว่า

เหตุใดจึงต้องมีสแน็ปช็อตบนระบบจัดเก็บข้อมูล

  • การสำรองข้อมูลแบบไม่ใช้เอเจนต์โดยตรงจากระบบจัดเก็บข้อมูล
  • สร้างสภาพแวดล้อมการทดสอบตามข้อมูลจริง
  • ในกรณีของระบบจัดเก็บไฟล์ สามารถใช้เพื่อสร้างสภาพแวดล้อม VDI ผ่านการใช้สแน็ปช็อตของระบบจัดเก็บข้อมูลแทนไฮเปอร์ไวเซอร์
  • ตรวจสอบให้แน่ใจว่า RPO ต่ำโดยการสร้างสแน็ปช็อตตามกำหนดการที่ความถี่ที่สูงกว่าความถี่ในการสำรองข้อมูลอย่างมาก

โคลน

การโคลนโวลุ่ม - ทำงานบนหลักการเดียวกันกับสแน็ปช็อต แต่ไม่ได้ใช้เพื่อการอ่านข้อมูลเท่านั้น แต่ยังใช้เพื่อการทำงานอย่างเต็มที่ด้วย เราสามารถรับสำเนาวอลุ่มของเราที่มีข้อมูลทั้งหมดอยู่ได้อย่างถูกต้อง โดยไม่ต้องทำสำเนาจริง ซึ่งจะช่วยประหยัดพื้นที่ โดยทั่วไปแล้ว การโคลนโวลุ่มจะใช้ใน Test&Dev หรือหากคุณต้องการตรวจสอบการทำงานของการอัปเดตบางอย่างบน IS ของคุณ การโคลนจะช่วยให้คุณทำสิ่งนี้ได้อย่างรวดเร็วและประหยัดที่สุดในแง่ของทรัพยากรดิสก์เพราะว่า เฉพาะบล็อกข้อมูลที่เปลี่ยนแปลงเท่านั้นที่จะถูกเขียน

การจำลองแบบ/การบันทึก

การจำลองแบบเป็นกลไกในการสร้างสำเนาข้อมูลบนระบบจัดเก็บข้อมูลจริงอื่น โดยปกติแล้ว ผู้จำหน่ายแต่ละรายจะมีเทคโนโลยีที่เป็นกรรมสิทธิ์ซึ่งใช้งานได้เฉพาะภายในสายงานของตนเองเท่านั้น แต่ยังมีโซลูชันของบริษัทอื่น รวมถึงโซลูชันที่ทำงานในระดับไฮเปอร์ไวเซอร์ เช่น VMware vSphere Replication

ฟังก์ชันการทำงานของเทคโนโลยีที่เป็นกรรมสิทธิ์และความสะดวกในการใช้งานมักจะเหนือกว่าเทคโนโลยีสากลมาก แต่กลับกลายเป็นว่าไม่สามารถใช้งานได้เมื่อจำเป็นต้องสร้างแบบจำลองจาก NetApp เป็น HP MSA

การจำลองแบบแบ่งออกเป็น XNUMX ประเภทย่อย:

ซิงโครนัส. ในกรณีของการจำลองแบบซิงโครนัส การดำเนินการเขียนจะถูกส่งไปยังระบบจัดเก็บข้อมูลที่สองทันที และการดำเนินการจะไม่ได้รับการยืนยันจนกว่าระบบจัดเก็บข้อมูลระยะไกลจะยืนยัน ด้วยเหตุนี้ ความล่าช้าในการเข้าถึงจึงเพิ่มขึ้น แต่เรามีสำเนาข้อมูลแบบมิเรอร์ที่แน่นอน เหล่านั้น. RPO = 0 ในกรณีที่ระบบจัดเก็บข้อมูลหลักสูญหาย

อะซิงโครนัส. การดำเนินการเขียนจะดำเนินการบนระบบจัดเก็บข้อมูลหลักเท่านั้น และได้รับการยืนยันทันที ขณะเดียวกันก็สะสมในบัฟเฟอร์สำหรับการส่งชุดข้อมูลไปยังระบบจัดเก็บข้อมูลระยะไกล การจำลองประเภทนี้เกี่ยวข้องกับข้อมูลที่มีค่าน้อยกว่า หรือสำหรับช่องที่มีแบนด์วิดท์ต่ำหรือเวลาแฝงสูง (โดยทั่วไปสำหรับระยะทางมากกว่า 100 กม.) ดังนั้น RPO = ความถี่ในการส่งแพ็คเก็ต

บ่อยครั้งมีกลไกควบคู่ไปกับการจำลองแบบ การบันทึก การดำเนินงานของดิสก์ ในกรณีนี้ มีการจัดสรรพื้นที่พิเศษสำหรับการบันทึกและการบันทึกการดำเนินการในระดับความลึกที่แน่นอนหรือถูกจำกัดโดยปริมาณของบันทึก สำหรับเทคโนโลยีที่เป็นกรรมสิทธิ์บางอย่าง เช่น EMC RecoverPoint มีการผสานรวมกับซอฟต์แวร์ระบบที่ช่วยให้คุณสามารถเชื่อมโยงบุ๊กมาร์กบางอย่างกับรายการบันทึกเฉพาะได้ ด้วยเหตุนี้ จึงเป็นไปได้ที่จะย้อนกลับสถานะของวอลุ่ม (หรือสร้างโคลน) ไม่ใช่แค่วันที่ 23 เมษายน 11 ชั่วโมง 59 วินาที 13 มิลลิวินาที แต่ยังรวมถึงช่วงเวลาก่อนหน้า "DROP ALL TABLES; ให้สัญญา."

คลัสเตอร์เมโทร

คลัสเตอร์ Metro เป็นเทคโนโลยีที่ช่วยให้คุณสามารถสร้างการจำลองแบบซิงโครนัสแบบสองทิศทางระหว่างระบบจัดเก็บข้อมูลสองระบบในลักษณะที่จากภายนอกคู่นี้ดูเหมือนระบบจัดเก็บข้อมูลเดียว ใช้เพื่อสร้างกระจุกที่มีแขนแยกทางภูมิศาสตร์ในระยะทางรถไฟใต้ดิน (น้อยกว่า 100 กม.)

ตามตัวอย่างการใช้งานในสภาพแวดล้อมการจำลองเสมือน เมโทรคลัสเตอร์ช่วยให้คุณสร้างพื้นที่เก็บข้อมูลด้วยเครื่องเสมือน ซึ่งสามารถเข้าถึงได้สำหรับการบันทึกจากศูนย์ข้อมูลสองแห่งพร้อมกัน ในกรณีนี้ คลัสเตอร์จะถูกสร้างขึ้นที่ระดับไฮเปอร์ไวเซอร์ ซึ่งประกอบด้วยโฮสต์ในศูนย์ข้อมูลทางกายภาพที่แตกต่างกัน ซึ่งเชื่อมต่อกับพื้นที่เก็บข้อมูลนี้ ซึ่งช่วยให้คุณทำสิ่งต่อไปนี้:

  • กระบวนการกู้คืนอัตโนมัติเต็มรูปแบบหลังจากศูนย์ข้อมูลแห่งใดแห่งหนึ่งเสียชีวิต หากไม่มีเงินทุนเพิ่มเติม VM ทั้งหมดที่ทำงานในศูนย์ข้อมูลที่เสียชีวิตจะถูกรีสตาร์ทโดยอัตโนมัติในศูนย์ข้อมูลที่เหลือ RTO = การหมดเวลาคลัสเตอร์ความพร้อมใช้งานสูง (15 วินาทีสำหรับ VMware) + เวลาในการโหลดระบบปฏิบัติการและเริ่มบริการ
  • การหลีกเลี่ยงภัยพิบัติ หรือในภาษารัสเซีย การหลีกเลี่ยงภัยพิบัติ หากมีการวางแผนงานจ่ายไฟในศูนย์ข้อมูล 1 เราก็มีโอกาสที่จะย้ายภาระงานที่สำคัญทั้งหมดไปยังศูนย์ข้อมูล 2 อย่างไม่หยุดหย่อนล่วงหน้าก่อนที่งานจะเริ่มต้น

Virtualization

การจำลองเสมือนการจัดเก็บข้อมูลคือการใช้วอลุ่มจากระบบจัดเก็บข้อมูลอื่นเป็นดิสก์ในทางเทคนิค เครื่องจำลองเสมือนการจัดเก็บข้อมูลสามารถถ่ายโอนวอลลุมของผู้อื่นไปยังผู้ใช้บริการเสมือนเป็นวอลลุมของตัวเอง พร้อมทำมิเรอร์ไปยังระบบจัดเก็บข้อมูลอื่นไปพร้อมๆ กัน หรือแม้แต่สร้าง RAID จากวอลลุมภายนอกได้
ตัวแทนแบบคลาสสิกในคลาสการจำลองเสมือนของหน่วยเก็บข้อมูลคือ EMC VPLEX และ IBM SVC และแน่นอนว่าระบบจัดเก็บข้อมูลพร้อมฟังก์ชันการจำลองเสมือน - NetApp, Hitachi, IBM / Lenovo Storwize

เหตุใดจึงจำเป็น?

  • ความซ้ำซ้อนในระดับระบบจัดเก็บข้อมูล มิเรอร์ถูกสร้างขึ้นระหว่างวอลุ่ม และครึ่งหนึ่งสามารถอยู่บน HP 3Par และอีกครึ่งหนึ่งบน NetApp และเวอร์ชวลไลเซอร์นั้นมาจาก EMC
  • ย้ายข้อมูลโดยมีเวลาหยุดทำงานน้อยที่สุดระหว่างระบบจัดเก็บข้อมูลจากผู้ผลิตหลายราย สมมติว่าข้อมูลจำเป็นต้องได้รับการย้ายจาก 3Par เก่า ซึ่งจะถูกตัดออกไปยัง Dell ใหม่ ในกรณีนี้ ผู้บริโภคจะถูกตัดการเชื่อมต่อจาก 3Par ปริมาณจะถูกถ่ายโอนภายใต้ VPLEX และนำเสนอต่อผู้บริโภคอีกครั้ง เนื่องจากระดับเสียงไม่ได้เปลี่ยนแปลงไปสักหน่อย งานจึงดำเนินต่อไป กระบวนการมิเรอร์โวลุ่มไปยัง Dell ใหม่เริ่มต้นในเบื้องหลัง และเมื่อเสร็จสิ้น มิเรอร์จะเสียหายและ 3Par ถูกปิดใช้งาน
  • การจัดกลุ่มเมโทรคลัสเตอร์

การบีบอัด/การขจัดข้อมูลซ้ำซ้อน

การบีบอัดและการขจัดข้อมูลซ้ำซ้อนเป็นเทคโนโลยีที่ช่วยให้คุณสามารถประหยัดพื้นที่ดิสก์บนระบบจัดเก็บข้อมูลของคุณได้ เป็นเรื่องที่ควรกล่าวถึงทันทีว่าข้อมูลบางส่วนไม่ได้รับการบีบอัดและ/หรือการขจัดความซ้ำซ้อนตามหลักการ ในขณะที่ข้อมูลบางประเภทได้รับการบีบอัดและขจัดข้อมูลซ้ำซ้อนได้ดีกว่า และบางส่วนก็กลับกัน

การบีบอัดและการขจัดข้อมูลซ้ำซ้อนมี 2 ประเภท:

อินไลน์ — การบีบอัดและการขจัดข้อมูลซ้ำซ้อนของบล็อกข้อมูลเกิดขึ้นก่อนที่จะเขียนข้อมูลนี้ลงดิสก์ ดังนั้นระบบจะคำนวณเฉพาะแฮชของบล็อกและเปรียบเทียบในตารางกับแฮชที่มีอยู่ ประการแรก มันเร็วกว่าการเขียนลงดิสก์ และประการที่สอง เราไม่เปลืองพื้นที่ดิสก์เพิ่มเติม

โพสต์ - เมื่อดำเนินการเหล่านี้กับข้อมูลที่บันทึกไว้แล้วซึ่งอยู่ในดิสก์ ดังนั้นข้อมูลจะถูกเขียนลงดิสก์ก่อน จากนั้นจึงคำนวณแฮชและลบบล็อกที่ไม่จำเป็นและปล่อยทรัพยากรของดิสก์

เป็นเรื่องที่ควรค่าแก่การกล่าวว่าผู้ขายส่วนใหญ่ใช้ทั้งสองประเภท ซึ่งช่วยให้พวกเขาสามารถเพิ่มประสิทธิภาพกระบวนการเหล่านี้และเพิ่มประสิทธิภาพได้ ผู้จำหน่ายอุปกรณ์จัดเก็บข้อมูลส่วนใหญ่มียูทิลิตี้ที่ช่วยให้คุณสามารถวิเคราะห์ชุดข้อมูลของคุณได้ ยูทิลิตี้เหล่านี้ทำงานตามตรรกะเดียวกันกับที่ใช้ในระบบจัดเก็บข้อมูล ดังนั้นระดับประสิทธิภาพโดยประมาณจะเท่ากัน นอกจากนี้ โปรดทราบว่าผู้จำหน่ายหลายรายมีโปรแกรมรับประกันประสิทธิภาพที่รับประกันประสิทธิภาพที่ดีอย่างน้อยสำหรับประเภทข้อมูลบางประเภท (หรือทั้งหมด) และคุณไม่ควรละเลยโปรแกรมนี้เพราะด้วยการคำนวณระบบสำหรับงานของคุณโดยคำนึงถึงค่าสัมประสิทธิ์ประสิทธิภาพของระบบใดระบบหนึ่งคุณสามารถประหยัดปริมาณได้ นอกจากนี้ยังควรพิจารณาด้วยว่าโปรแกรมเหล่านี้ออกแบบมาสำหรับระบบ AFA แต่ด้วยการซื้อ SSD ในปริมาณที่น้อยกว่า HDD ในระบบคลาสสิกสิ่งนี้จะช่วยลดต้นทุนและหากไม่เท่ากับต้นทุนของระบบดิสก์ เข้าใกล้มันให้มาก

แบบ

และที่นี่เรามาถึงคำถามที่ถูกต้อง

“พวกเขามีทางเลือกในการจัดเก็บข้อมูลให้เลือกสองแบบ ได้แก่ ABC SuperStorage S600 และ XYZ HyperOcean 666v4 คุณจะแนะนำอะไร”

กลายเป็น “ที่นี่มีตัวเลือกพื้นที่จัดเก็บข้อมูลให้ฉันสองแบบ ได้แก่ ABC SuperStorage S600 และ XYZ HyperOcean 666v4 คุณจะแนะนำอะไร

โหลดเป้าหมายคือเครื่องเสมือน VMware ผสมกับลูปการผลิต/การทดสอบ/การพัฒนา ทดสอบ = มีประสิทธิผล 150 TB แต่ละตัวพร้อมประสิทธิภาพสูงสุด 80 IOPS 000kb บล็อกการเข้าถึงแบบสุ่ม 8% อ่าน-เขียน 50/80 20 TB สำหรับการพัฒนา 300 IOPS เพียงพอ สุ่ม 50 รายการ เขียน 000 รายการ

ประสิทธิภาพการผลิตน่าจะอยู่ในคลัสเตอร์เมโทรคลัสเตอร์ RPO = 15 นาที RTO = 1 ชั่วโมง การพัฒนาในการจำลองแบบอะซิงโครนัส RPO = 3 ชั่วโมง ทดสอบบนไซต์เดียว

จะมี DBMS ขนาด 50TB การบันทึกน่าจะดีสำหรับพวกเขา

เรามีเซิร์ฟเวอร์ของ Dell ทุกที่ ระบบจัดเก็บข้อมูลเก่าของ Hitachi ซึ่งแทบจะไม่สามารถรับมือได้ เราวางแผนที่จะเพิ่มภาระงานอีก 50% ในแง่ของปริมาณและประสิทธิภาพ”

อย่างที่พวกเขาพูด คำถามที่กำหนดอย่างถูกต้องประกอบด้วยคำตอบ 80%

ข้อมูลเพิ่มเติม

สิ่งที่คุณควรอ่านเพิ่มเติมตามผู้เขียน

หนังสือ

  • Olifer และ Olifer “เครือข่ายคอมพิวเตอร์” หนังสือเล่มนี้จะช่วยจัดระบบและอาจเข้าใจได้ดีขึ้นว่าสื่อการส่งข้อมูลสำหรับระบบจัดเก็บข้อมูล IP / Ethernet ทำงานอย่างไร
  • “การจัดเก็บและการจัดการข้อมูลของ EMC” หนังสือดีๆ เกี่ยวกับพื้นฐานของระบบจัดเก็บข้อมูล ทำไม วิธีการ และสาเหตุ

ฟอรัมและการแชท

คำแนะนำทั่วไป

ราคา

สำหรับราคา โดยทั่วไปแล้ว หากมีราคาสำหรับระบบจัดเก็บข้อมูล ก็มักจะเป็นราคาปลีก ซึ่งลูกค้าแต่ละรายจะได้รับส่วนลดเป็นรายบุคคล ขนาดของส่วนลดประกอบด้วยพารามิเตอร์จำนวนมาก ดังนั้นจึงเป็นไปไม่ได้เลยที่จะคาดเดาราคาสุดท้ายที่บริษัทของคุณจะได้รับโดยไม่ต้องถามผู้จัดจำหน่าย แต่ในขณะเดียวกันเมื่อเร็ว ๆ นี้โมเดลระดับล่างก็เริ่มปรากฏในร้านคอมพิวเตอร์ทั่วไปเป็นต้น nix.ru หรือ xcom-shop.ru. ที่นี่คุณสามารถซื้อระบบที่คุณสนใจได้ทันทีในราคาคงที่ เช่นเดียวกับส่วนประกอบของคอมพิวเตอร์อื่นๆ

แต่ฉันอยากจะทราบทันทีว่าการเปรียบเทียบโดยตรงด้วย TB/$ นั้นไม่ถูกต้อง หากเราเข้าใกล้จากมุมมองนี้ โซลูชันที่ถูกที่สุดจะเป็นเซิร์ฟเวอร์ JBOD + ธรรมดาซึ่งจะไม่ให้ความยืดหยุ่นหรือความน่าเชื่อถือตามที่ระบบจัดเก็บข้อมูลแบบคอนโทรลเลอร์คู่เต็มรูปแบบมอบให้ นี่ไม่ได้หมายความว่า JBOD น่าขยะแขยงและเป็นกลอุบายที่น่ารังเกียจ คุณเพียงแค่ต้องเข้าใจอย่างชัดเจนอีกครั้งว่าคุณจะใช้โซลูชันนี้อย่างไรและเพื่อวัตถุประสงค์อะไร คุณมักจะได้ยินว่าไม่มีอะไรเสียหายใน JBOD มีแบ็คเพลนเพียงอันเดียว อย่างไรก็ตาม บางครั้งแบ็คเพลนก็ล้มเหลวเช่นกัน ทุกอย่างพังไม่ช้าก็เร็ว

เบ็ดเสร็จ

จำเป็นต้องเปรียบเทียบระบบระหว่างกันไม่เพียงแต่ด้วยราคาหรือไม่เพียงแต่ประสิทธิภาพเท่านั้น แต่ยังรวมไปถึงผลรวมของตัวบ่งชี้ทั้งหมดด้วย

ซื้อ HDD เฉพาะในกรณีที่คุณแน่ใจว่าต้องการ HDD เท่านั้น สำหรับการโหลดต่ำและประเภทข้อมูลที่ไม่สามารถบีบอัดได้ มิฉะนั้น ก็คุ้มค่าที่จะเปลี่ยนไปใช้โปรแกรมรับประกันประสิทธิภาพการจัดเก็บข้อมูล SSD ซึ่งผู้ขายส่วนใหญ่มีในขณะนี้ (และใช้งานได้จริงแม้ในรัสเซีย) แต่ทั้งหมดขึ้นอยู่กับแอปพลิเคชันและข้อมูลที่จะอยู่ ในระบบจัดเก็บข้อมูลนี้

อย่าไปราคาถูก บางครั้งสิ่งเหล่านี้ก็ซ่อนช่วงเวลาที่ไม่พึงประสงค์มากมายซึ่งหนึ่งในนั้น Evgeniy Elizarov อธิบายไว้ในบทความของเขาเกี่ยวกับ อินฟอร์เทรน. และสุดท้ายแล้วความเลวก็สามารถส่งผลย้อนกลับมาสู่คุณได้ อย่าลืมว่า “คนขี้เหนียวจ่ายสองเท่า”

ที่มา: www.habr.com

เพิ่มความคิดเห็น