البروس در مقابل اینتل مقایسه عملکرد سیستم های ذخیره سازی Aerodisk Vostok و Engine

البروس در مقابل اینتل مقایسه عملکرد سیستم های ذخیره سازی Aerodisk Vostok و Engine

سلام به همه. در ادامه شما را با سیستم ذخیره سازی اطلاعات Aerodisk VOSTOK بر پایه پردازنده روسی Elbrus 8C آشنا می کنیم.

در این مقاله (همانطور که قول داده بودیم) یکی از محبوب ترین و جالب ترین موضوعات مرتبط با البروس یعنی بهره وری را به تفصیل تحلیل خواهیم کرد. حدس و گمان های بسیار زیادی در مورد عملکرد البروس وجود دارد و کاملاً قطبی است. بدبینان می گویند که بهره وری البروس اکنون "هیچ" است و دهه ها طول می کشد تا به تولید کنندگان "برترین" برسد (یعنی در واقعیت فعلی هرگز). از سوی دیگر، خوش بینان می گویند که Elbrus 8C در حال حاضر نتایج خوبی از خود نشان می دهد و در یکی دو سال آینده با عرضه نسخه های جدید پردازنده ها (Elbrus 16C و 32C)، می توانیم «به عقب برسیم و سبقت بگیریم». تولید کنندگان پیشرو پردازنده در جهان

ما در Aerodisk افرادی عملی هستیم، بنابراین ساده ترین و قابل فهم ترین مسیر (برای ما) را انتخاب کردیم: آزمایش، نتایج را ثبت کنید و تنها پس از آن نتیجه گیری کنید. در نتیجه، تعداد زیادی آزمایش انجام دادیم و تعدادی از ویژگی‌های عملیاتی معماری Elbrus 8C e2k (از جمله موارد دلپذیر) را کشف کردیم و البته این را با سیستم‌های ذخیره‌سازی مشابه در پردازنده‌های معماری Intel Xeon amd64 مقایسه کردیم.

به هر حال، ما در وبینار بعدی خود "OkoloIT" در 15.10.2020 اکتبر 15 در ساعت 00:XNUMX با جزئیات بیشتری در مورد آزمایش ها، نتایج و توسعه آینده سیستم های ذخیره سازی در Elbrus صحبت خواهیم کرد. می توانید با استفاده از لینک زیر ثبت نام کنید.

ثبت نام برای وبینار

پایه تست

ما دو غرفه ایجاد کرده ایم. هر دو پایه شامل یک سرور لینوکس هستند که از طریق سوئیچ‌های FC 16G به دو کنترلر ذخیره‌سازی متصل شده‌اند، که در آن 12 دیسک SAS SSD 960 گیگابایتی نصب شده است (11,5 ترابایت ظرفیت خام یا 5,7 ترابایت ظرفیت «قابل استفاده»، اگر از RAID استفاده کنیم. -10).

از نظر شماتیک، پایه به این شکل است.

البروس در مقابل اینتل مقایسه عملکرد سیستم های ذخیره سازی Aerodisk Vostok و Engine

پایه شماره 1 e2k (البروس)

پیکربندی سخت افزار به شرح زیر است:

  • سرور لینوکس (2xIntel Xeon E5-2603 v4 (6 هسته، 1,70 گیگاهرتز)، 64 گیگابایت DDR4، 2xFC آداپتور 16G 2 پورت) – 1 عدد.
  • سوئیچ FC 16 G – 2 عدد.
  • سیستم ذخیره سازی Aerodisk Vostok 2-E12 (2xElbrus 8C (8 هسته، 1,20 گیگاهرتز)، 32 گیگابایت DDR3، 2xFE-آداپتور FC 16G 2 پورت، 12xSAS SSD 960 گیگابایت) - 1 عدد.

استند شماره 2 amd64 (اینتل)

برای مقایسه با یک پیکربندی مشابه در e2k، ما از یک پیکربندی ذخیره سازی مشابه با پردازنده ای مشابه مشخصات amd64 استفاده کردیم:

  • سرور لینوکس (2xIntel Xeon E5-2603 v4 (6 هسته، 1,70 گیگاهرتز)، 64 گیگابایت DDR4، 2xFC آداپتور 16G 2 پورت) – 1 عدد.
  • سوئیچ FC 16 G – 2 عدد.
  • سیستم ذخیره سازی Aerodisk Engine N2 (2xIntel Xeon E5-2603 v4 (6 هسته، 1,70 گیگاهرتز)، 32 گیگابایت DDR4، 2xFE آداپتور FC 16G 2 پورت، 12xSAS SSD 960 گیگابایت) - 1 عدد.

نکته مهم: پردازنده‌های Elbrus 8C مورد استفاده در تست فقط از رم DDR3 پشتیبانی می‌کنند، این البته "بد است، اما نه برای مدت طولانی". Elbrus 8SV (هنوز آن را در انبار نداریم، اما به زودی آن را خواهیم داشت) از DDR4 پشتیبانی می کند.

روش آزمون

برای تولید بار، از برنامه محبوب و تست شده Flexible IO (FIO) استفاده کردیم.

هر دو سیستم ذخیره‌سازی بر اساس توصیه‌های پیکربندی ما، بر اساس الزامات عملکرد بالا در دسترسی بلوک پیکربندی شده‌اند، بنابراین ما از مخزن‌های دیسک DDP (Dynamic Disk Pool) استفاده می‌کنیم. برای اینکه نتایج آزمایش را مخدوش نکنیم، فشرده سازی، حذف مجدد و حافظه رم را در هر دو سیستم ذخیره سازی غیرفعال می کنیم.

8 D-LUN در RAID-10، هر کدام 500 گیگابایت، با ظرفیت کل قابل استفاده 4 ترابایت (یعنی تقریباً 70 درصد از ظرفیت قابل استفاده ممکن در این پیکربندی) ایجاد شد.

سناریوهای اساسی و محبوب برای استفاده از سیستم های ذخیره سازی اجرا خواهد شد، به ویژه:

دو تست اول عملکرد یک DBMS تراکنشی را تقلید می کنند. در این گروه از تست ها به IOPS و تاخیر علاقه مندیم.

1) خواندن تصادفی در بلوک های کوچک 4k
آ. اندازه بلوک = 4k
ب خواندن/نوشتن = 100%/0%
ج. تعداد کار = 8
د عمق صف = 32
ه. کاراکتر بار = تصادفی کامل

2) ضبط تصادفی در بلوک های کوچک 4k
آ. اندازه بلوک = 4k
ب خواندن/نوشتن = 0%/100%
ج. تعداد کار = 8
د عمق صف = 32
ه. کاراکتر بار = تصادفی کامل

دو تست دوم عملکرد بخش تحلیلی DBMS را تقلید می کنند. در این گروه از تست‌ها به IOPS و تاخیر نیز علاقه داریم.

3) خواندن متوالی در بلوک های کوچک 4k
آ. اندازه بلوک = 4k
ب خواندن/نوشتن = 100%/0%
ج. تعداد کار = 8
د عمق صف = 32
ه. کاراکتر بار = ترتیبی

4) ضبط متوالی در بلوک های کوچک 4k
آ. اندازه بلوک = 4k
ب خواندن/نوشتن = 0%/100%
ج. تعداد کار = 8
د عمق صف = 32
ه. کاراکتر بار = ترتیبی

گروه سوم آزمایش‌ها کار خواندن جریان (به عنوان مثال: پخش آنلاین، بازیابی پشتیبان‌گیری) و ضبط جریان (مثال: نظارت تصویری، ضبط پشتیبان‌گیری) را تقلید می‌کنند. در این گروه از تست ها، دیگر به IOPS علاقه مند نیستیم، بلکه به MB/s و همچنین تأخیر علاقه داریم.

5) خواندن متوالی در بلوک های بزرگ 128k
آ. اندازه بلوک = 128k
ب خواندن/نوشتن = 0%/100%
ج. تعداد کار = 8
د عمق صف = 32
ه. کاراکتر بار = ترتیبی

6) ضبط متوالی در بلوک های بزرگ 128k
آ. اندازه بلوک = 128k
ب خواندن/نوشتن = 0%/100%
ج. تعداد کار = 8
د عمق صف = 32
ه. کاراکتر بار = ترتیبی

هر آزمون یک ساعت طول می کشد، به استثنای زمان گرم کردن آرایه 7 دقیقه.

نتایج آزمون

نتایج آزمون در دو جدول خلاصه شده است.

Elbrus 8S (SHD Aerodisk Vostok 2-E12)

البروس در مقابل اینتل مقایسه عملکرد سیستم های ذخیره سازی Aerodisk Vostok و Engine

Intel Xeon E5-2603 v4 (سیستم ذخیره سازی Aerodisk Engine N2)

البروس در مقابل اینتل مقایسه عملکرد سیستم های ذخیره سازی Aerodisk Vostok و Engine

نتایج بسیار جالب بود. در هر دو مورد، ما به خوبی از قدرت پردازش سیستم ذخیره سازی (70-90٪ استفاده) استفاده کردیم و در این شرایط، مزایا و معایب هر دو پردازنده به وضوح مشهود است.

در هر دو جدول، تست‌هایی که پردازنده‌ها «احساس اعتماد به نفس دارند» و نتایج خوبی نشان می‌دهند با رنگ سبز مشخص می‌شوند، در حالی که موقعیت‌هایی که پردازنده‌ها «دوست ندارند» با رنگ نارنجی مشخص می‌شوند.

اگر در مورد بار تصادفی در بلوک های کوچک صحبت کنیم، پس:

  • از نقطه نظر خواندن تصادفی ، اینتل مطمئناً از البروس جلوتر است ، تفاوت 2 برابر است.
  • از نقطه نظر ضبط تصادفی قطعاً مساوی است، هر دو پردازنده نتایج تقریباً برابر و مناسبی را نشان دادند.

در یک بار متوالی در بلوک های کوچک، تصویر متفاوت است:

  • هم هنگام خواندن و نوشتن، اینتل به طور قابل توجهی (2 برابر) از البروس جلوتر است. در عین حال، اگر Elbrus دارای نشانگر IOPS پایین تر از اینتل باشد، اما مناسب به نظر برسد (200-300 هزار)، پس یک مشکل آشکار با تاخیر وجود دارد (آنها سه برابر بیشتر از اینتل هستند). نتیجه گیری، نسخه فعلی Elbrus 8C واقعاً بارهای متوالی را در بلوک های کوچک "دوست ندارد". واضح است که کارهایی باید انجام شود.

اما در یک بار متوالی با بلوک های بزرگ، تصویر دقیقا برعکس است:

  • هر دو پردازنده نتایج تقریباً مساوی در مگابایت بر ثانیه نشان دادند، اما یک BUT وجود دارد ... عملکرد تأخیر البروس 10 (ده، کارل!!!) برابر بهتر (یعنی کمتر) از پردازنده مشابه اینتل (0,4/0,5 میلی ثانیه در مقابل 5,1/6,5 میلی ثانیه) است. در ابتدا فکر کردیم که یک مشکل است، بنابراین دوباره نتایج را بررسی کردیم، یک آزمایش مجدد انجام دادیم، اما آزمایش مجدد همان تصویر را نشان داد. این یک مزیت جدی البروس (و معماری e2k به طور کلی) نسبت به اینتل (و بر این اساس، معماری amd64) است. امیدواریم این موفقیت بیشتر توسعه یابد.

یکی دیگر از ویژگی های جالب البروس وجود دارد که یک خواننده با دقت می تواند با دیدن جدول به آن توجه کند. اگر به تفاوت عملکرد خواندن و نوشتن اینتل نگاه کنید، در تمام تست‌ها، خواندن به طور متوسط ​​حدود 50٪ + از نوشتن جلوتر است. این هنجاری است که همه (از جمله ما) به آن عادت کرده اند. اگر به البروس نگاه کنید، شاخص‌های نوشتن بسیار به شاخص‌های خواندن نزدیک‌تر هستند؛ خواندن به طور معمول 10 تا 30 درصد از نوشتن جلوتر است، نه بیشتر.

این یعنی چی؟ این واقعیت که البروس واقعاً نوشتن را دوست دارد، و این به نوبه خود، نشان می‌دهد که این پردازنده در کارهایی که نوشتن به وضوح بر خواندن غالب است (که قانون یارووایا را گفته است؟) بسیار مفید خواهد بود، که همچنین یک مزیت بدون شک معماری e2k است، و این مزیت باید توسعه یابد.

نتیجه گیری و آینده نزدیک

آزمایش‌های مقایسه‌ای پردازنده‌های میان‌رده البروس و اینتل برای وظایف ذخیره‌سازی داده‌ها نتایج تقریباً برابر و به همان اندازه ارزشمند را نشان دادند، در حالی که هر پردازنده ویژگی‌های جالب خود را نشان داد.

اینتل در خواندن تصادفی در بلوک های کوچک و همچنین در خواندن و نوشتن متوالی در بلوک های کوچک بسیار بهتر از البروس عمل کرد.

هنگام نوشتن تصادفی در بلوک های کوچک، هر دو پردازنده نتایج یکسانی را نشان می دهند.

از نظر تأخیر، البروس در بارگذاری جریان به طور قابل توجهی بهتر از اینتل به نظر می رسد. در خواندن و نوشتن متوالی در بلوک های بزرگ.

علاوه بر این، البروس، برخلاف اینتل، با هر دو بار خواندن و نوشتن به یک اندازه خوب کنار می آید، در حالی که در اینتل، خواندن همیشه بسیار بهتر از نوشتن است.
بر اساس نتایج به‌دست‌آمده، می‌توانیم در مورد کاربرد سیستم‌های ذخیره‌سازی داده‌های Aerodisk Vostok بر روی پردازنده Elbrus 8C در وظایف زیر نتیجه‌گیری کنیم:

  • سیستم های اطلاعاتی با غلبه عملیات نوشتن؛
  • دسترسی به فایل؛
  • پخش آنلاین؛
  • دوربین مدار بسته
  • پشتیبان گیری؛
  • محتوای رسانه.

تیم MCST هنوز چیزی برای کار کردن دارد، اما نتیجه کار آنها از قبل قابل مشاهده است، که البته نمی تواند شادی کند.

این آزمایش‌ها بر روی هسته لینوکس برای نسخه e2k 4.19 انجام شد؛ در حال حاضر در آزمایش‌های بتا (در MCST، در Basalt SPO، و همچنین در اینجا در Aerodisk) یک هسته لینوکس 5.4-e2k وجود دارد که از جمله موارد دیگر، دارای به طور جدی برنامه‌ریزی مجدد و بهینه‌سازی‌های زیادی برای درایوهای حالت جامد پرسرعت طراحی شده است. همچنین، به طور خاص برای هسته های شاخه 5.x.x، MCST JSC یک کامپایلر جدید LCC، نسخه 1.25 را منتشر می کند. طبق نتایج اولیه، در همان پردازنده Elbrus 8C، یک هسته جدید که با یک کامپایلر جدید، یک محیط هسته، ابزارهای سیستم و کتابخانه ها و در واقع نرم افزار Aerodisk VOSTOK کامپایل شده است، افزایش قابل توجهی در عملکرد را امکان پذیر می کند. و این بدون تعویض تجهیزات است - در همان پردازنده و با همان فرکانس.

انتظار داریم تا پایان سال نسخه ای از Aerodisk VOSTOK بر اساس هسته 5.4 منتشر شود و به محض اتمام کار بر روی نسخه جدید، نتایج آزمایش را به روز کرده و در اینجا نیز منتشر خواهیم کرد.

اگر اکنون به ابتدای مقاله برگردیم و به این سوال پاسخ دهیم، حق با چه کسی است: بدبینانی که می گویند البروس «هیچی» است و هرگز به تولیدکنندگان برجسته پردازنده نمی رسد، یا خوش بینانی که می گویند «تقریباً گیر افتاده اند». بالا و به زودی سبقت خواهد گرفت "؟ اگر نه از روی کلیشه‌ها و تعصبات مذهبی، بلکه از آزمون‌های واقعی حرکت کنیم، قطعاً خوش‌بین‌ها درست می‌گویند.

البروس در حال حاضر نتایج خوبی را در مقایسه با پردازنده های سطح متوسط ​​amd64 نشان می دهد. البته Elbrus 8-ke با بهترین مدل‌های پردازنده‌های سرور اینتل یا AMD فاصله زیادی دارد، اما هدف آن نبود؛ پردازنده‌های 16C و 32C برای این منظور عرضه خواهند شد. بعد از آن با هم صحبت خواهیم کرد.

ما متوجه شدیم که بعد از این مقاله سوالات بیشتری در مورد البروس وجود خواهد داشت، بنابراین تصمیم گرفتیم تا یک وبینار آنلاین دیگر "OkoloIT" را برای پاسخگویی به این سوالات به صورت زنده سازماندهی کنیم.

این بار مهمان ما معاون مدیر کل شرکت MCST، کنستانتین تروشکین خواهد بود. از طریق لینک زیر می توانید در وبینار ثبت نام کنید.

ثبت نام برای وبینار

با تشکر از همه شما، مثل همیشه منتظر انتقادات سازنده و سوالات جالب هستیم.

منبع: www.habr.com

اضافه کردن نظر