เอลบรุส VS อินเทล เปรียบเทียบประสิทธิภาพของ Aerodisk Vostok และระบบจัดเก็บข้อมูลเครื่องยนต์

เอลบรุส VS อินเทล เปรียบเทียบประสิทธิภาพของ Aerodisk Vostok และระบบจัดเก็บข้อมูลเครื่องยนต์

สวัสดีทุกคน. เรายังคงแนะนำให้คุณรู้จักกับระบบจัดเก็บข้อมูล Aerodisk VOSTOK ที่ใช้โปรเซสเซอร์ Russian Elbrus 8C

ในบทความนี้เรา (ตามที่สัญญาไว้) จะวิเคราะห์รายละเอียดหนึ่งในหัวข้อยอดนิยมและน่าสนใจที่เกี่ยวข้องกับ Elbrus ได้แก่ ประสิทธิภาพการทำงาน มีการคาดเดามากมายเกี่ยวกับประสิทธิภาพของ Elbrus และมีการคาดเดาเชิงขั้วอย่างแน่นอน ผู้มองโลกในแง่ร้ายกล่าวว่าผลผลิตของ Elbrus ตอนนี้ "ไม่มีอะไร" และต้องใช้เวลาหลายทศวรรษกว่าจะตามทันผู้ผลิต "ชั้นนำ" (นั่นคือ ในความเป็นจริงในปัจจุบัน ไม่เคยเลย) ในทางกลับกัน ผู้มองโลกในแง่ดีกล่าวว่า Elbrus 8C แสดงผลลัพธ์ที่ดีแล้ว และในอีกไม่กี่ปีข้างหน้า ด้วยการเปิดตัวโปรเซสเซอร์เวอร์ชันใหม่ (Elbrus 16C และ 32C) เราจะสามารถ "ตามทันและแซงหน้า" ได้ ผู้ผลิตโปรเซสเซอร์ชั้นนำของโลก

พวกเราที่ Aerodisk เป็นคนที่ปฏิบัติได้จริง ดังนั้นเราจึงใช้เส้นทางที่ง่ายและเข้าใจได้มากที่สุด (สำหรับเรา) ได้แก่ ทดสอบ บันทึกผลลัพธ์ และจากนั้นจึงทำการสรุปผล ด้วยเหตุนี้ เราทำการทดสอบจำนวนมากและค้นพบคุณสมบัติการทำงานของสถาปัตยกรรม Elbrus 8C e2k (รวมถึงคุณสมบัติที่น่าพอใจ) และแน่นอนว่าเมื่อเปรียบเทียบกับระบบจัดเก็บข้อมูลที่คล้ายกันบนโปรเซสเซอร์สถาปัตยกรรม Intel Xeon amd64

อย่างไรก็ตาม เราจะพูดคุยโดยละเอียดเพิ่มเติมเกี่ยวกับการทดสอบ ผลลัพธ์ และการพัฒนาในอนาคตของระบบจัดเก็บข้อมูลบน Elbrus ในการสัมมนาผ่านเว็บครั้งต่อไป “OkoloIT” ในวันที่ 15.10.2020 ตุลาคม 15 เวลา 00:XNUMX น. คุณสามารถลงทะเบียนโดยใช้ลิงก์ด้านล่าง

ลงทะเบียนสำหรับการสัมมนาผ่านเว็บ

แท่นทดสอบ

เราได้สร้างอัฒจันทร์สองแห่ง สแตนด์ทั้งสองประกอบด้วยเซิร์ฟเวอร์ที่ใช้ Linux เชื่อมต่อผ่าน 16G FC สลับไปยังตัวควบคุมการจัดเก็บข้อมูลสองตัว โดยติดตั้งดิสก์ SAS SSD 12 GB จำนวน 960 ตัว (ความจุ "ดิบ" 11,5 TB หรือความจุ "ใช้งานได้" 5,7 TB หากเราใช้ RAID -10)

แผนผังขาตั้งมีลักษณะเช่นนี้

เอลบรุส VS อินเทล เปรียบเทียบประสิทธิภาพของ Aerodisk Vostok และระบบจัดเก็บข้อมูลเครื่องยนต์

สแตนด์หมายเลข 1 e2k (เอลบรุส)

การกำหนดค่าฮาร์ดแวร์มีดังนี้:

  • เซิร์ฟเวอร์ Linux (2xIntel Xeon E5-2603 v4 (6 คอร์, 1,70Ghz), 64 GB DDR4, อะแดปเตอร์ 2xFC 16G 2 พอร์ต) – 1 ชิ้น
  • สวิตช์ FC 16 G – 2 ชิ้น
  • ระบบจัดเก็บข้อมูล Aerodisk Vostok 2-E12 (2xElbrus 8C (8 คอร์, 1,20Ghz), 32 GB DDR3, 2xFE FC-อะแดปเตอร์ 16G 2 พอร์ต, 12xSAS SSD 960 GB) - 1 ชิ้น

สแตนด์หมายเลข 2 amd64 (Intel)

สำหรับการเปรียบเทียบกับการกำหนดค่าที่คล้ายกันบน e2k เราใช้การกำหนดค่าพื้นที่เก็บข้อมูลที่คล้ายกันกับโปรเซสเซอร์ที่มีลักษณะคล้ายกับ amd64:

  • เซิร์ฟเวอร์ Linux (2xIntel Xeon E5-2603 v4 (6 คอร์, 1,70Ghz), 64 GB DDR4, อะแดปเตอร์ 2xFC 16G 2 พอร์ต) – 1 ชิ้น
  • สวิตช์ FC 16 G – 2 ชิ้น
  • ระบบจัดเก็บข้อมูล Aerodisk Engine N2 (2xIntel Xeon E5-2603 v4 (6 คอร์, 1,70Ghz), 32 GB DDR4, 2xFE FC-อะแดปเตอร์ 16G 2 พอร์ต, 12xSAS SSD 960 GB) - 1 ชิ้น

หมายเหตุสำคัญ: โปรเซสเซอร์ Elbrus 8C ที่ใช้ในการทดสอบรองรับเฉพาะ DDR3 RAM ซึ่งแน่นอนว่า "แย่ แต่ไม่นาน" Elbrus 8SV (เรายังไม่มีในสต็อก แต่จะมีเร็วๆ นี้) รองรับ DDR4

วิธีการทดสอบ

ในการสร้างภาระงาน เราใช้โปรแกรม Flex IO (FIO) ที่ได้รับความนิยมและผ่านการทดสอบตามเวลา

ระบบจัดเก็บข้อมูลทั้งสองได้รับการกำหนดค่าตามคำแนะนำในการกำหนดค่าของเรา โดยอิงตามข้อกำหนดสำหรับการเข้าถึงบล็อกที่มีประสิทธิภาพสูง ดังนั้นเราจึงใช้ดิสก์พูล DDP (ไดนามิกดิสก์พูล) เพื่อไม่ให้ผลการทดสอบบิดเบือน เราจะปิดใช้งานการบีบอัด การขจัดข้อมูลซ้ำซ้อน และแคช RAM บนระบบจัดเก็บข้อมูลทั้งสองระบบ

D-LUN 8 ตัวถูกสร้างขึ้นใน RAID-10 ตัวละ 500 GB โดยมีความจุที่ใช้งานได้รวม 4 TB (นั่นคือ ประมาณ 70% ของความจุที่ใช้งานได้ที่เป็นไปได้ของการกำหนดค่านี้)

สถานการณ์พื้นฐานและยอดนิยมสำหรับการใช้ระบบจัดเก็บข้อมูลจะได้รับการดำเนินการ โดยเฉพาะ:

การทดสอบสองรายการแรกจำลองการทำงานของ DBMS ของทรานแซคชัน ในกลุ่มการทดสอบนี้ เราสนใจ IOPS และเวลาในการตอบสนอง

1) การอ่านแบบสุ่มในบล็อกขนาดเล็ก 4k
ก. ขนาดบล็อก = 4k
ข. อ่าน/เขียน = 100%/0%
ค. จำนวนงาน = 8
ง. ความลึกของคิว = 32
จ. โหลดตัวละคร = สุ่มเต็ม

2) การบันทึกแบบสุ่มในบล็อกขนาดเล็ก 4k
ก. ขนาดบล็อก = 4k
ข. อ่าน/เขียน = 0%/100%
ค. จำนวนงาน = 8
ง. ความลึกของคิว = 32
จ. โหลดตัวละคร = สุ่มเต็ม

การทดสอบสองรายการที่สองจะจำลองการทำงานของส่วนวิเคราะห์ของ DBMS ในกลุ่มการทดสอบนี้ เรายังสนใจ IOPS และเวลาในการตอบสนองอีกด้วย

3) การอ่านตามลำดับในบล็อกขนาดเล็ก 4k
ก. ขนาดบล็อก = 4k
ข. อ่าน/เขียน = 100%/0%
ค. จำนวนงาน = 8
ง. ความลึกของคิว = 32
จ. โหลดอักขระ = ตามลำดับ

4) การบันทึกตามลำดับในบล็อกขนาดเล็ก 4k
ก. ขนาดบล็อก = 4k
ข. อ่าน/เขียน = 0%/100%
ค. จำนวนงาน = 8
ง. ความลึกของคิว = 32
จ. โหลดอักขระ = ตามลำดับ

การทดสอบกลุ่มที่สามจำลองการทำงานของการอ่านแบบสตรีมมิ่ง (ตัวอย่าง: การออกอากาศออนไลน์ การกู้คืนข้อมูลสำรอง) และการบันทึกแบบสตรีมมิ่ง (ตัวอย่าง: การเฝ้าระวังวิดีโอ การสำรองข้อมูลการบันทึก) ในการทดสอบกลุ่มนี้ เราไม่สนใจ IOPS อีกต่อไป แต่สนใจในเรื่อง MB/s และเวลาแฝงด้วย

5) การอ่านตามลำดับในบล็อกขนาดใหญ่ 128k
ก. ขนาดบล็อก = 128k
ข. อ่าน/เขียน = 0%/100%
ค. จำนวนงาน = 8
ง. ความลึกของคิว = 32
จ. โหลดอักขระ = ตามลำดับ

6) การบันทึกตามลำดับในบล็อกขนาดใหญ่ 128k
ก. ขนาดบล็อก = 128k
ข. อ่าน/เขียน = 0%/100%
ค. จำนวนงาน = 8
ง. ความลึกของคิว = 32
จ. โหลดอักขระ = ตามลำดับ

การทดสอบแต่ละครั้งจะใช้เวลาหนึ่งชั่วโมง ไม่รวมเวลาอุ่นเครื่องอาเรย์ 7 นาที

ผลการทดสอบ

ผลการทดสอบสรุปเป็นสองตาราง

Elbrus 8S (SHD Aerodisk วอสต็อก 2-E12)

เอลบรุส VS อินเทล เปรียบเทียบประสิทธิภาพของ Aerodisk Vostok และระบบจัดเก็บข้อมูลเครื่องยนต์

Intel Xeon E5-2603 v4 (ระบบจัดเก็บข้อมูล Aerodisk Engine N2)

เอลบรุส VS อินเทล เปรียบเทียบประสิทธิภาพของ Aerodisk Vostok และระบบจัดเก็บข้อมูลเครื่องยนต์

ผลลัพธ์ออกมาน่าสนใจมาก ในทั้งสองกรณี เราใช้พลังการประมวลผลของระบบจัดเก็บข้อมูลอย่างเหมาะสม (การใช้งาน 70-90%) และในสถานการณ์นี้ ข้อดีและข้อเสียของโปรเซสเซอร์ทั้งสองก็เห็นได้ชัดเจนอย่างชัดเจน

ในทั้งสองตาราง การทดสอบที่โปรเซสเซอร์ "รู้สึกมั่นใจ" และแสดงผลลัพธ์ที่ดีจะถูกเน้นด้วยสีเขียว ในขณะที่สถานการณ์ที่โปรเซสเซอร์ "ไม่ชอบ" จะถูกเน้นด้วยสีส้ม

หากเราพูดถึงการโหลดแบบสุ่มในบล็อกเล็ก ๆ แล้ว:

  • จากมุมมองของการอ่านแบบสุ่ม Intel เหนือกว่า Elbrus อย่างแน่นอนความแตกต่างคือ 2 เท่า
  • จากมุมมองของการบันทึกแบบสุ่มมันเป็นการเสมอกันอย่างแน่นอนโปรเซสเซอร์ทั้งสองแสดงผลลัพธ์ที่เท่าเทียมกันและเหมาะสมโดยประมาณ

ในการโหลดตามลำดับในบล็อกเล็ก ๆ รูปภาพจะแตกต่างออกไป:

  • ทั้งในด้านการอ่านและการเขียน Intel เหนือกว่า Elbrus อย่างมาก (2 เท่า) ในเวลาเดียวกันหาก Elbrus มีตัวบ่งชี้ IOPS ต่ำกว่าของ Intel แต่ดูดี (200-300) แสดงว่ามีปัญหาที่ชัดเจนเกี่ยวกับความล่าช้า (สูงกว่าของ Intel สามเท่า) สรุปได้ว่า Elbrus 8C เวอร์ชันปัจจุบัน "ไม่ชอบ" การโหลดตามลำดับในบล็อกขนาดเล็กจริงๆ เห็นได้ชัดว่ามีงานบางอย่างที่ต้องทำ

แต่ในการโหลดตามลำดับที่มีบล็อกขนาดใหญ่ รูปภาพจะตรงกันข้ามทุกประการ:

  • โปรเซสเซอร์ทั้งสองแสดงผลลัพธ์ที่เท่ากันโดยประมาณในหน่วย MB/s แต่มีหนึ่งตัว แต่.... ประสิทธิภาพเวลาในการตอบสนองของ Elbrus นั้นดีกว่า 10 (สิบ, Karl!!!) เท่า (เช่น ต่ำกว่า) กว่าโปรเซสเซอร์ที่คล้ายกันจาก Intel (0,4/0,5 ms เทียบกับ 5,1/6,5 ms) ตอนแรกเราคิดว่ามันเป็นความผิดพลาด เราจึงตรวจสอบผลลัพธ์อีกครั้ง ทดสอบซ้ำ แต่การทดสอบซ้ำกลับแสดงภาพเหมือนเดิม นี่เป็นข้อได้เปรียบที่สำคัญของ Elbrus (และสถาปัตยกรรม e2k โดยทั่วไป) เหนือ Intel (และสถาปัตยกรรม amd64 ตามลำดับ) หวังว่าความสำเร็จนี้จะได้รับการพัฒนาต่อไป

มีคุณลักษณะที่น่าสนใจอีกประการหนึ่งของ Elbrus ซึ่งผู้อ่านที่เอาใจใส่สามารถให้ความสนใจได้โดยการดูที่โต๊ะ หากคุณดูความแตกต่างระหว่างประสิทธิภาพการอ่านและเขียนของ Intel ในการทดสอบทั้งหมด การอ่านจะเหนือกว่าการเขียนโดยเฉลี่ยประมาณ 50%+ นี่เป็นบรรทัดฐานที่ทุกคน (รวมถึงเราด้วย) คุ้นเคย หากคุณดูที่ Elbrus ตัวบ่งชี้การเขียนจะอยู่ใกล้กับตัวบ่งชี้การอ่านมากขึ้น ตามกฎแล้วการอ่านจะอยู่ข้างหน้าการเขียนประมาณ 10 - 30% ไม่มากไปกว่านี้

สิ่งนี้หมายความว่า? ความจริงที่ว่า Elbrus "รักการเขียน" จริงๆ และนี่ก็แสดงให้เห็นว่าโปรเซสเซอร์นี้จะมีประโยชน์มากในงานที่การเขียนมีชัยเหนือการอ่านอย่างชัดเจน (ใครบอกว่ากฎของ Yarovaya?) ซึ่งเป็นข้อได้เปรียบที่ไม่ต้องสงสัย สถาปัตยกรรม e2k และ ข้อดีนี้ต้องได้รับการพัฒนา

บทสรุปและอนาคตอันใกล้นี้

การทดสอบเปรียบเทียบระหว่างโปรเซสเซอร์ระดับกลาง Elbrus และ Intel สำหรับงานจัดเก็บข้อมูลแสดงให้เห็นผลลัพธ์ที่เท่าเทียมกันและคุ้มค่าเท่าเทียมกัน ในขณะที่โปรเซสเซอร์แต่ละตัวแสดงคุณสมบัติที่น่าสนใจของตัวเอง

Intel มีประสิทธิภาพเหนือกว่า Elbrus อย่างมากในด้านการอ่านแบบสุ่มในบล็อกขนาดเล็ก เช่นเดียวกับการอ่านและการเขียนตามลำดับในบล็อกขนาดเล็ก

เมื่อเขียนแบบสุ่มเป็นบล็อกเล็กๆ โปรเซสเซอร์ทั้งสองจะแสดงผลลัพธ์ที่เท่ากัน

ในแง่ของเวลาแฝง Elbrus ดูดีกว่า Intel อย่างมากในการโหลดสตรีมมิ่งเช่น ในการอ่านและเขียนตามลำดับในบล็อกขนาดใหญ่

นอกจากนี้ Elbrus ซึ่งแตกต่างจาก Intel ที่สามารถรับมือกับทั้งการอ่านและเขียนได้ดีพอ ๆ กัน ในขณะที่สำหรับ Intel การอ่านจะดีกว่าการเขียนเสมอ
จากผลลัพธ์ที่ได้รับเราสามารถสรุปเกี่ยวกับการบังคับใช้ระบบจัดเก็บข้อมูล Aerodisk Vostok บนโปรเซสเซอร์ Elbrus 8C ในงานต่อไปนี้:

  • ระบบสารสนเทศที่มีความโดดเด่นในการดำเนินการเขียน
  • การเข้าถึงไฟล์
  • การออกอากาศออนไลน์
  • กล้องวงจรปิด;
  • สำรอง;
  • เนื้อหาสื่อ

ทีมงาน MCST ยังคงมีบางอย่างที่ต้องทำ แต่ผลงานของพวกเขาก็ปรากฏให้เห็นแล้ว ซึ่งแน่นอนว่าไม่สามารถชื่นชมยินดีได้

การทดสอบเหล่านี้ดำเนินการบนเคอร์เนล Linux สำหรับ e2k เวอร์ชัน 4.19 ปัจจุบันอยู่ในการทดสอบเบต้า (ใน MCST ใน Basalt SPO และที่นี่ใน Aerodisk) มีเคอร์เนล Linux 5.4-e2k ซึ่งเหนือสิ่งอื่นใดก็มี ได้รับการออกแบบใหม่อย่างจริงจังและการเพิ่มประสิทธิภาพมากมายสำหรับไดรฟ์โซลิดสเทตความเร็วสูง นอกจากนี้ โดยเฉพาะสำหรับเคอร์เนลของสาขา 5.x.x MCST JSC เผยแพร่ LCC คอมไพเลอร์เวอร์ชัน 1.25 ใหม่ ตามผลลัพธ์เบื้องต้น เคอร์เนลใหม่ที่คอมไพล์ด้วยคอมไพเลอร์ใหม่ สภาพแวดล้อมเคอร์เนล ยูทิลิตี้ระบบ และไลบรารีบนโปรเซสเซอร์ Elbrus 8C เดียวกัน และในความเป็นจริง ซอฟต์แวร์ Aerodisk VOSTOK จะช่วยให้ประสิทธิภาพเพิ่มขึ้นอย่างมีนัยสำคัญยิ่งขึ้น และนี่คือโดยไม่ต้องเปลี่ยนอุปกรณ์ - บนโปรเซสเซอร์เดียวกันและมีความถี่เท่ากัน

เราคาดว่าจะมีการเปิดตัว Aerodisk VOSTOK เวอร์ชันที่ใช้เคอร์เนล 5.4 ภายในสิ้นปีนี้ และทันทีที่การทำงานกับเวอร์ชันใหม่เสร็จสมบูรณ์ เราจะอัปเดตผลการทดสอบและเผยแพร่ที่นี่ด้วย

หากเรากลับไปที่จุดเริ่มต้นของบทความและตอบคำถามว่าใครถูก: ผู้มองโลกในแง่ร้ายที่บอกว่า Elbrus "ไม่มีอะไร" และจะไม่มีวันตามผู้ผลิตโปรเซสเซอร์ชั้นนำหรือผู้มองโลกในแง่ดีที่พูดว่า "พวกเขาเกือบจะจับได้แล้ว ขึ้นไปอีกไม่นานจะแซง"? หากเราไม่ได้ดำเนินการตามแบบเหมารวมและอคติทางศาสนา แต่มาจากการทดสอบจริง ผู้มองโลกในแง่ดีย่อมถูกต้องอย่างแน่นอน

Elbrus แสดงผลลัพธ์ที่ดีแล้วเมื่อเปรียบเทียบกับโปรเซสเซอร์ amd64 ระดับกลาง แน่นอนว่า Elbrus 8-ke นั้นยังห่างไกลจากโปรเซสเซอร์เซิร์ฟเวอร์รุ่นท็อปสุดจาก Intel หรือ AMD แต่ไม่ได้มุ่งเป้าไปที่นั้น โปรเซสเซอร์ 16C และ 32C จะเปิดตัวเพื่อจุดประสงค์นี้ แล้วเราจะพูดคุย.

เราเข้าใจดีว่าหลังจากบทความนี้ จะมีคำถามเพิ่มเติมเกี่ยวกับ Elbrus ดังนั้นเราจึงตัดสินใจจัดสัมมนาผ่านเว็บออนไลน์อีกครั้ง “OkoloIT” เพื่อตอบคำถามเหล่านี้แบบสดๆ

ครั้งนี้แขกของเราจะเป็นรองผู้อำนวยการทั่วไปของบริษัท MCST, Konstantin Trushkin คุณสามารถลงทะเบียนเข้าร่วมสัมมนาผ่านเว็บได้โดยใช้ลิงก์ด้านล่าง

ลงทะเบียนสำหรับการสัมมนาผ่านเว็บ

ขอขอบคุณทุกท่านเช่นเคย เราหวังว่าจะได้รับคำวิจารณ์ที่สร้างสรรค์และคำถามที่น่าสนใจ

ที่มา: will.com

เพิ่มความคิดเห็น