ฤดูร้อนในมอสโกปีนี้พูดตามตรงว่าไม่ค่อยดีนัก มันเริ่มต้นเร็วเกินไปและเร็วเกินไป ไม่ใช่ทุกคนที่มีเวลาตอบสนองต่อมัน และมันก็จบลงแล้วเมื่อปลายเดือนมิถุนายน ดังนั้น เมื่อ Huawei ชวนผมไปจีน เมืองเฉิงตู ซึ่งเป็นที่ตั้งของศูนย์ RnD หลังจากดูพยากรณ์อากาศในร่ม +34 องศา ผมก็ตอบตกลงทันที ท้ายที่สุดฉันก็อายุไม่เท่ากันแล้วและฉันต้องวอร์มกระดูกสักหน่อย แต่ฉันอยากจะทราบว่ามันเป็นไปได้ที่จะอุ่นไม่เพียงแต่กระดูกเท่านั้น แต่ยังรวมถึงอวัยวะภายในด้วย เนื่องจากมณฑลเสฉวนซึ่งเป็นที่ตั้งของเฉิงตูตั้งอยู่นั้นมีชื่อเสียงในด้านความรักในอาหารรสเผ็ด แต่ถึงกระนั้น นี่ไม่ใช่บล็อกเกี่ยวกับการเดินทาง ดังนั้นเรากลับมาที่เป้าหมายหลักของการเดินทางของเรา - ระบบจัดเก็บข้อมูลแนวใหม่ - Huawei Dorado V6 บทความนี้จะพาคุณย้อนอดีตไปสักหน่อย เพราะ... เขียนก่อนประกาศอย่างเป็นทางการ แต่เผยแพร่หลังการเผยแพร่เท่านั้น ดังนั้นวันนี้เราจะมาดูทุกสิ่งที่น่าสนใจและอร่อยที่ Huawei เตรียมไว้ให้เราอย่างละเอียดยิ่งขึ้น
โดยจะมีทั้งหมด 5 รุ่นในไลน์ใหม่ ทุกรุ่นยกเว้น 3000V6 สามารถมีได้สองเวอร์ชัน - SAS และ NVMe ตัวเลือกนี้จะกำหนดอินเทอร์เฟซของดิสก์ที่คุณสามารถใช้ได้ในระบบนี้ พอร์ต Back-End และจำนวนดิสก์ไดรฟ์ที่คุณสามารถติดตั้งในระบบได้ สำหรับ NVMe จะใช้ SSD ขนาดเท่าฝ่ามือ ซึ่งบางกว่า SAS SSD แบบคลาสสิกขนาด 2.5 นิ้ว และสามารถติดตั้งได้สูงสุด 36 ชิ้น บรรทัดใหม่คือ All Flash และไม่มีการกำหนดค่าด้วยดิสก์
ปาล์ม NVMe SSD
ในความคิดของฉัน Dorado 8000 และ 18000 ดูเหมือนรุ่นที่น่าสนใจที่สุด Huawei วางตำแหน่งให้เป็นระบบระดับไฮเอนด์และด้วยนโยบายการกำหนดราคาของ Huawei มันจึงทำให้รุ่นระดับกลางเหล่านี้แตกต่างกับกลุ่มคู่แข่ง นี่คือโมเดลเหล่านี้ที่ฉันจะเน้นในการรีวิววันนี้ ฉันจะทราบทันทีว่าเนื่องจากคุณสมบัติการออกแบบ ระบบควบคุมดูอัลรุ่นเยาว์จึงมีสถาปัตยกรรมที่แตกต่างกันเล็กน้อย แตกต่างจาก Dorado 8000 และ 18000 ดังนั้น ไม่ใช่ทุกสิ่งที่ฉันจะพูดถึงในวันนี้จะใช้ได้กับรุ่นจูเนียร์
หนึ่งในคุณสมบัติหลักของระบบใหม่คือการใช้ชิปหลายตัวที่พัฒนาขึ้นภายในบริษัท ซึ่งแต่ละชิปทำให้คุณสามารถกระจายโหลดแบบลอจิคัลจากโปรเซสเซอร์กลางของคอนโทรลเลอร์ และเพิ่มฟังก์ชันการทำงานให้กับส่วนประกอบต่างๆ
หัวใจสำคัญของระบบใหม่คือโปรเซสเซอร์ Kunpeng 920 ซึ่งพัฒนาโดยใช้เทคโนโลยี ARM และผลิตโดย Huawei โดยแยกจากกัน จำนวนคอร์ ความถี่ และจำนวนโปรเซสเซอร์ที่ติดตั้งในคอนโทรลเลอร์แต่ละตัวจะแตกต่างกันไปขึ้นอยู่กับรุ่น:
Huawei Dorado V6 8000 – 2CPU, 64 คอร์
Huawei Dorado V6 18000 – 4CPU, 48 คอร์
Huawei พัฒนาโปรเซสเซอร์นี้บนสถาปัตยกรรม ARM และเท่าที่ฉันรู้ในตอนแรกวางแผนที่จะติดตั้งเฉพาะในรุ่น Dorado 8000 และ 18000 รุ่นเก่าเท่านั้นเช่นเดียวกับในรุ่น V5 บางรุ่นแล้ว แต่การคว่ำบาตรได้ปรับเปลี่ยนแนวคิดนี้ แน่นอนว่า ARM ยังพูดถึงการปฏิเสธที่จะร่วมมือกับ Huawei ในระหว่างที่มีการคว่ำบาตร แต่สถานการณ์ที่นี่แตกต่างจากกับ Intel Huawei ผลิตชิปเหล่านี้โดยอิสระ และไม่มีมาตรการคว่ำบาตรใดๆ ที่สามารถหยุดกระบวนการนี้ได้ การตัดความสัมพันธ์กับ ARM เป็นเพียงภัยคุกคามต่อการสูญเสียการเข้าถึงการพัฒนาใหม่ๆ สำหรับประสิทธิภาพนั้นจะสามารถตัดสินได้หลังจากทำการทดสอบอิสระเท่านั้น แม้ว่าฉันจะเห็นว่า 18000M IOPS ถูกลบออกจากระบบ Dorado 1 โดยไม่มีปัญหาใด ๆ จนกว่าฉันจะทำซ้ำด้วยมือของฉันเองบนชั้นวางของฉัน แต่ฉันไม่เชื่อเลย แต่คอนโทรลเลอร์มีพลังมากมายจริงๆ รุ่นเก่าจะมีคอนโทรลเลอร์ 4 ตัว แต่ละตัวมีโปรเซสเซอร์ 4 ตัว รวมเป็น 768 คอร์
แต่ฉันจะพูดถึงคอร์ในภายหลัง เมื่อเราดูสถาปัตยกรรมของระบบใหม่ แต่สำหรับตอนนี้ เรากลับมาที่ชิปตัวอื่นที่ติดตั้งในระบบกันก่อน ชิปดูเหมือนเป็นวิธีแก้ปัญหาที่น่าสนใจอย่างยิ่ง
มาดูสถาปัตยกรรมกันดีกว่า Huawei ยังคงพัฒนาเทคโนโลยี Smart Matrix ของตัวเองอย่างต่อเนื่อง ซึ่งใช้แนวทางแบบตาข่ายเต็มรูปแบบในการเชื่อมต่อส่วนประกอบต่างๆ แต่หากใน V5 เป็นเพียงการเข้าถึงจากคอนโทรลเลอร์ไปยังดิสก์เท่านั้น ตอนนี้คอนโทรลเลอร์ทั้งหมดสามารถเข้าถึงพอร์ตทั้งหมดทั้งบน Back-End และ Front-End
ด้วยสถาปัตยกรรมไมโครเซอร์วิสใหม่ ซึ่งช่วยให้สามารถปรับสมดุลโหลดระหว่างคอนโทรลเลอร์ทั้งหมดได้ แม้ว่าจะมีเพียง lun ตัวเดียวก็ตาม ระบบปฏิบัติการสำหรับกลุ่มอาร์เรย์นี้ได้รับการพัฒนาตั้งแต่ต้นจนจบ และไม่เพียงแต่ได้รับการปรับให้เหมาะสมสำหรับการใช้งานแฟลชไดรฟ์เท่านั้น เนื่องจากคอนโทรลเลอร์ของเราทั้งหมดสามารถเข้าถึงพอร์ตเดียวกัน ในกรณีที่คอนโทรลเลอร์ล้มเหลวหรือรีบูต โฮสต์จะไม่สูญเสียเส้นทางเดียวไปยังระบบจัดเก็บข้อมูล และการสลับเส้นทางจะดำเนินการที่ระดับระบบจัดเก็บข้อมูล อย่างไรก็ตาม การใช้ UltraPath บนโฮสต์นั้นไม่จำเป็นอย่างยิ่ง “การประหยัด” อีกประการหนึ่งเมื่อติดตั้งระบบคือลิงก์ที่จำเป็นจำนวนน้อยกว่า และหากใช้แนวทาง "คลาสสิก" สำหรับคอนโทรลเลอร์ 4 ตัวเราจะต้องมี 8 ลิงก์จากโรงงาน 2 แห่ง ดังนั้นในกรณีของ Huawei แม้แต่ 2 แห่งก็เพียงพอแล้ว (ตอนนี้ฉันไม่ได้พูดถึงความเพียงพอของปริมาณงานของลิงก์เดียว)
เช่นเดียวกับเวอร์ชันก่อนหน้า มีการใช้แคชส่วนกลางพร้อมการมิเรอร์ สิ่งนี้ช่วยให้คุณสูญเสียคอนโทรลเลอร์ได้มากถึงสองตัวพร้อมกันหรือสามคอนโทรลเลอร์ตามลำดับโดยไม่ส่งผลกระทบต่อความพร้อมใช้งาน แต่เป็นที่น่าสังเกตว่าเราไม่เห็นความสมดุลของโหลดที่สมบูรณ์ระหว่างคอนโทรลเลอร์ 3 ตัวที่เหลือในกรณีที่เกิดข้อผิดพลาดประการหนึ่งที่แท่นสาธิต โหลดของคอนโทรลเลอร์ที่ล้มเหลวถูกควบคุมโดยหนึ่งในตัวควบคุมที่เหลือทั้งหมด เป็นไปได้ว่าในกรณีนี้จำเป็นต้องปล่อยให้ระบบทำงานนานขึ้นในการกำหนดค่านี้ ไม่ว่าในกรณีใด ฉันจะตรวจสอบรายละเอียดเพิ่มเติมโดยใช้การทดสอบของฉันเอง
Huawei กำลังวางตำแหน่งระบบใหม่เป็นระบบ NVMe แบบ End-to-End แต่ในปัจจุบัน NVMeOF ยังไม่ได้รับการสนับสนุนที่ส่วนหน้า มีเพียง FC, iSCSI หรือ NFS เท่านั้น ในตอนท้ายของสิ่งนี้หรือจุดเริ่มต้นของถัดไป เช่นเดียวกับคุณสมบัติอื่น ๆ เราได้รับสัญญาว่าจะสนับสนุน RoCE
ชั้นวางยังเชื่อมต่อกับตัวควบคุมโดยใช้ RoCE และมีข้อเสียเปรียบประการหนึ่งที่เกี่ยวข้องกับสิ่งนี้ - การขาดการเชื่อมต่อแบบ "ย้อนกลับ" ของชั้นวาง เช่นเดียวกับในกรณีของ SAS ในความคิดของฉัน นี่ยังคงเป็นข้อเสียเปรียบที่ค่อนข้างใหญ่หากคุณกำลังวางแผนระบบที่ค่อนข้างใหญ่ ความจริงก็คือชั้นวางทั้งหมดเชื่อมต่อกันเป็นชุด และความล้มเหลวของชั้นวางใดชั้นวางหนึ่งส่งผลให้ชั้นวางอื่นๆ ที่ตามมาไม่สามารถเข้าถึงได้โดยสิ้นเชิง ในกรณีนี้ เพื่อให้มั่นใจถึงความทนทานต่อข้อผิดพลาด เราจะต้องเชื่อมต่อชั้นวางทั้งหมดเข้ากับคอนโทรลเลอร์ ซึ่งจะทำให้จำนวนพอร์ตแบ็กเอนด์ที่ต้องการในระบบเพิ่มขึ้น
และอีกสิ่งหนึ่งที่ควรกล่าวถึงก็คือการอัปเดตแบบไม่รบกวน (NDU) ดังที่ฉันได้กล่าวไว้ข้างต้น Huawei ได้ใช้แนวทางคอนเทนเนอร์เพื่อปฏิบัติการระบบปฏิบัติการสำหรับกลุ่มผลิตภัณฑ์ Dorado ใหม่ ซึ่งช่วยให้คุณสามารถอัปเดตและรีสตาร์ทบริการโดยไม่จำเป็นต้องรีบูตคอนโทรลเลอร์ทั้งหมด เป็นเรื่องที่ควรกล่าวถึงทันทีว่าการอัปเดตบางอย่างจะมีการอัปเดตเคอร์เนลและในกรณีนี้ บางครั้งอาจยังจำเป็นต้องรีบูตตัวควบคุมแบบคลาสสิกในระหว่างการอัปเดต แต่ก็ไม่เสมอไป ซึ่งจะช่วยลดผลกระทบของการดำเนินการนี้ต่อระบบการผลิต
ในคลังแสงของเรา อาเรย์ส่วนใหญ่มาจาก NetApp ดังนั้นฉันคิดว่ามันจะค่อนข้างสมเหตุสมผลถ้าฉันเปรียบเทียบเล็กน้อยกับระบบที่ฉันต้องทำงานค่อนข้างมาก นี่ไม่ใช่ความพยายามที่จะตัดสินว่าใครดีกว่าและใครแย่กว่าหรือสถาปัตยกรรมของใครได้เปรียบกว่า ฉันจะพยายามอย่างมีสติและไม่คลั่งไคล้ในการเปรียบเทียบสองแนวทางที่แตกต่างกันในการแก้ปัญหาเดียวกันจากผู้ขายที่แตกต่างกัน ใช่ แน่นอน ในกรณีนี้ เราจะพิจารณาระบบของ Huawei ใน "ทฤษฎี" และฉันจะแยกประเด็นเหล่านั้นที่วางแผนไว้ไปใช้ในเฟิร์มแวร์เวอร์ชันอนาคตด้วย ฉันเห็นข้อดีอะไรบ้างในขณะนี้:
- จำนวนไดรฟ์ NVMe ที่รองรับ ปัจจุบัน NetApp มี 288 ตัว ขณะที่ Huawei มี 1600-6400 แล้วแต่รุ่น ในเวลาเดียวกัน ความจุสูงสุดที่ใช้งานได้ของ Huawei คือ 32PBe เช่นเดียวกับระบบ NetApp (หรือให้แม่นยำยิ่งขึ้นคือมี 31.64PBe) และแม้ว่าจะรองรับไดรฟ์ที่มีปริมาณเท่ากันก็ตาม (สูงสุด 15Tb) Huawei อธิบายข้อเท็จจริงนี้ดังนี้: พวกเขาไม่ได้มีโอกาสประกอบขาตั้งที่ใหญ่กว่านี้ ตามทฤษฎีแล้ว พวกเขาไม่มีการจำกัดปริมาณ แต่พวกเขายังไม่สามารถทดสอบข้อเท็จจริงนี้ได้ แต่ที่นี่เป็นที่น่าสังเกตว่าความสามารถของแฟลชไดรฟ์ในปัจจุบันนั้นสูงมากและในกรณีของระบบ NVMe เราต้องเผชิญกับความจริงที่ว่า 24 ไดรฟ์นั้นเพียงพอที่จะใช้ระบบควบคุม 2 คอนโทรลเลอร์ระดับบนสุด ดังนั้น การเพิ่มจำนวนดิสก์ในระบบเพิ่มเติมจะไม่เพียงแต่ไม่เพิ่มประสิทธิภาพการทำงานเท่านั้น แต่ยังส่งผลเสียต่ออัตราส่วน IOPS/Tb อีกด้วย แน่นอนว่าคุ้มค่าที่จะเห็นว่าระบบควบคุม 4 คอนโทรลเลอร์ 8000 และ 16000 สามารถรองรับไดรฟ์ได้จำนวนเท่าใด เนื่องจาก... ความสามารถและศักยภาพของ Kunpeng 920 ยังไม่ชัดเจนนัก
- การมีอยู่ของ Lun ในฐานะเจ้าของระบบ NetApp เหล่านั้น. ตัวควบคุมเพียงตัวเดียวเท่านั้นที่สามารถดำเนินการกับดวงจันทร์ได้ ในขณะที่ตัวควบคุมตัวที่สองส่ง IO ผ่านตัวมันเองเท่านั้น ในทางตรงกันข้าม ระบบของ Huawei ไม่มีเจ้าของและการดำเนินการที่มีบล็อกข้อมูล (การบีบอัด การขจัดข้อมูลซ้ำซ้อน) สามารถทำได้โดยตัวควบคุมใดๆ เช่นเดียวกับการเขียนลงดิสก์
- ไม่มีพอร์ตหลุดเมื่อคอนโทรลเลอร์ตัวใดตัวหนึ่งทำงานล้มเหลว สำหรับบางคน ช่วงเวลานี้ดูวิกฤติอย่างยิ่ง สิ่งที่สำคัญที่สุดคือการสลับภายในระบบจัดเก็บข้อมูลควรเกิดขึ้นเร็วกว่าฝั่งโฮสต์ และหากในกรณีของ NetApp เดียวกัน ในทางปฏิบัติเราพบว่าค้างประมาณ 5 วินาทีเมื่อดึงตัวควบคุมออกและเปลี่ยนเส้นทาง จากนั้นเมื่อเปลี่ยนมาใช้ Huawei เรายังคงต้องฝึกฝน
- ไม่จำเป็นต้องรีสตาร์ทคอนโทรลเลอร์เมื่อทำการอัพเดต สิ่งนี้เริ่มทำให้ฉันกังวลเป็นพิเศษด้วยการเปิดตัวเวอร์ชันใหม่และสาขาเฟิร์มแวร์สำหรับ NetApps ที่ค่อนข้างบ่อย ใช่ การอัปเดตบางอย่างสำหรับ Huawei ยังคงจำเป็นต้องรีสตาร์ท แต่ไม่ใช่ทั้งหมด
- คอนโทรลเลอร์ Huawei 4 ตัวในราคาคอนโทรลเลอร์ NetApp สองตัว ดังที่ฉันได้กล่าวไว้ข้างต้น ต้องขอบคุณนโยบายการกำหนดราคาของ Huawei ที่ทำให้สามารถแข่งขันกับรุ่นระดับกลางด้วยรุ่นระดับไฮเอนด์ได้
- การมีอยู่ของชิปเพิ่มเติมในตัวควบคุมชั้นวางและพอร์ตการ์ด ซึ่งอาจมีวัตถุประสงค์เพื่อปรับปรุงประสิทธิภาพของระบบ
ข้อเสียและข้อกังวลโดยทั่วไป:
- การเชื่อมต่อชั้นวางกับคอนโทรลเลอร์โดยตรง หรือความต้องการพอร์ตแบ็คเอนด์จำนวนมากเพื่อเชื่อมต่อชั้นวางทั้งหมดเข้ากับคอนโทรลเลอร์
- สถาปัตยกรรม ARM และการมีอยู่ของชิปจำนวนมาก - มันจะทำงานได้อย่างมีประสิทธิภาพแค่ไหนและประสิทธิภาพจะเพียงพอหรือไม่?
ความกังวลและความกลัวส่วนใหญ่สามารถขจัดออกไปได้ด้วยการทดสอบบรรทัดใหม่เป็นการส่วนตัว ฉันหวังว่าหลังจากการเปิดตัวไม่นานพวกเขาจะปรากฏตัวในมอสโกวและจะมีเพียงพอสำหรับการทดสอบของคุณเองอย่างรวดเร็ว จนถึงตอนนี้ เราสามารถพูดได้ว่าโดยทั่วไปแล้วแนวทางของบริษัทดูน่าสนใจ และกลุ่มผลิตภัณฑ์ใหม่ก็ดูดีมากเมื่อเทียบกับคู่แข่ง การใช้งานขั้นสุดท้ายทำให้เกิดคำถามมากมายเพราะว่า เราจะเห็นหลายๆ อย่างเฉพาะช่วงสิ้นปี และอาจจะแค่ปี 2020 เท่านั้น
ที่มา: will.com