لطفا به خاطر عنوان نتیجه گیری عجولانه نکنید! ما استدلال های سنگینی برای پشتیبانی از آن داریم و تا جایی که می توانستیم آنها را جمع و جور کرده ایم. ما پستی را در مورد مفهوم و اصول عملکرد سیستم ذخیره سازی جدید ما که در ژانویه 2020 منتشر شد، به شما توجه می کنیم.
به نظر ما، مزیت رقابتی اصلی خانواده ذخیره سازی Dorado V6 با عملکرد و قابلیت اطمینان ذکر شده در عنوان ارائه می شود. بله، بله، خیلی ساده است، اما چه تصمیمات دشوار و نه چندان دشواری را برای رسیدن به این "ساده" انجام دادیم، امروز صحبت خواهیم کرد.
به منظور آزادسازی بهتر پتانسیل سیستم های نسل جدید، در مورد نمایندگان قدیمی طیف مدل (مدل های 8000، 18000) صحبت خواهیم کرد. مگر اینکه غیر از این بیان شود، آنها باید باشند.
چند کلمه در مورد بازار
برای درک بهتر جایگاه راهحلهای هواوی در بازار، اجازه دهید به یک معیار اثبات شده بپردازیم - "
در سال 2019، گارتنر در مطالعه خود، هر دو بخش فوق را در یک - "ذخیره اصلی" ترکیب کرد. در نتیجه، هوآوی بار دیگر در ربع رهبر و در کنار فروشندگانی مانند IBM، Hitachi Vantara و Infinidat قرار گرفت.
برای تکمیل تصویر، توجه می کنیم که گارتنر 80٪ از داده ها را برای تجزیه و تحلیل در بازار ایالات متحده جمع آوری می کند و این منجر به سوگیری قابل توجهی به نفع آن دسته از شرکت هایی می شود که به خوبی در ایالات متحده نمایندگی دارند. در همین حال، تامین کنندگانی که به بازارهای اروپایی و آسیایی گرایش دارند، خود را در موقعیتی آشکارا کمتر سودمند می یابند. با وجود این، سال گذشته محصولات هوآوی جایگاه شایسته خود را در ربع بالا سمت راست گرفتند و طبق حکم گارتنر، "ممکن است برای استفاده توصیه شوند."
چیزهای جدید در Dorado V6
خط تولید Dorado V6 به طور خاص با سیستمهای سطح پایه 3000 نشان داده میشود. در ابتدا با دو کنترلر مجهز شدهاند، میتوان آنها را به صورت افقی به 16 کنترلر، 1200 درایو و 192 گیگابایت حافظه پنهان افزایش داد. همچنین این سیستم به درگاههای خارجی Fiber Channel (8 / 16 / 32 Gb / s) و Ethernet (1 / 10 / 25 / 40 / 100 Gb / s) مجهز خواهد شد.
توجه داشته باشید که استفاده از پروتکلهایی که موفقیت تجاری ندارند اکنون در حال حذف شدن است، بنابراین در ابتدا تصمیم گرفتیم پشتیبانی از کانال فیبر روی اترنت (FCoE) و Infiniband (IB) را کنار بگذاریم. آنها در نسخه های سیستم عامل بعدی اضافه خواهند شد. پشتیبانی از NVMe بر روی فابریک (NVMe-oF) خارج از جعبه در بالای کانال فیبر در دسترس است. سفتافزار بعدی که قرار است در ژوئن منتشر شود، قرار است از NVMe از طریق حالت اترنت پشتیبانی کند. به نظر ما مجموعه فوق بیشتر از نیازهای اکثر مشتریان هواوی را پوشش خواهد داد.
دسترسی به فایل در نسخه میانافزار فعلی موجود نیست و در یکی از بهروزرسانیهای بعدی در اواخر سال ظاهر میشود. پیاده سازی در سطح بومی، توسط خود کنترل کننده ها با پورت های اترنت، بدون استفاده از تجهیزات اضافی فرض می شود.
تفاوت اصلی بین مدل های سری Dorado V6 3000 با مدل های قدیمی تر این است که از یک پروتکل در پشتیبان پشتیبانی می کند - SAS 3.0. بر این اساس، درایوهای موجود در آنجا فقط با رابط نامگذاری شده قابل استفاده هستند. از دیدگاه ما، عملکرد ارائه شده توسط این برای دستگاهی از این نوع کاملاً کافی است.
سیستم های سری Dorado V6 5000 و 6000 راه حل های میان رده هستند. آنها همچنین در فرم فاکتور 2U و مجهز به دو کنترلر ساخته شده اند. آنها از نظر عملکرد، تعداد پردازنده ها، حداکثر تعداد دیسک ها و اندازه کش با یکدیگر متفاوت هستند. با این حال، از نظر معماری و مهندسی، Dorado V6 5000 و 6000 یکسان هستند و ظاهر یکسانی دارند.
کلاس Hi-End شامل سیستم های سری Dorado V6 8000 و 18000 می شود که در اندازه 4U ساخته شده اند و به طور پیش فرض دارای معماری جداگانه ای هستند که در آن کنترلرها و درایوها از هم فاصله دارند. آنها همچنین می توانند حداقل با دو کنترلر همراه باشند، اگرچه مشتریان معمولاً چهار یا بیشتر درخواست می کنند.
Dorado V6 8000 تا 16 کنترلر و Dorado V6 18000 تا 32 مقیاس می شود. این سیستم ها دارای پردازنده های مختلف با تعداد هسته ها و اندازه های کش متفاوت هستند. در عین حال، هویت راه حل های مهندسی مانند مدل های کلاس میانی حفظ می شود.
قفسه های ذخیره سازی 2U از طریق RDMA با پهنای باند 100 گیگابیت بر ثانیه متصل می شوند. باطن Dorado V6 قدیمیتر نیز از SAS 3.0 پشتیبانی میکند، اما در مواردی که SSD با این رابط قیمت بسیار کاهش مییابد، بیشتر پشتیبانی میکند. در این صورت حتی با در نظر گرفتن بهره وری پایین تر، استفاده از آنها امکان اقتصادی خواهد داشت. در حال حاضر تفاوت هزینه ها بین SSD ها با رابط های SAS و NVMe به قدری ناچیز است که ما آمادگی ارائه چنین راه حلی را نداریم.
داخل کنترلر
کنترلرهای Dorado V6 بر پایه عنصر خود ما ساخته شده اند. بدون پردازنده از اینتل، بدون ASIC از Broadcom. بنابراین، تک تک اجزای مادربرد و همچنین خود مادربرد به طور کامل از خطرات ناشی از فشار تحریمها از سوی شرکتهای آمریکایی حذف میشوند. کسانی که هر یک از تجهیزات ما را با چشم خود دیده اند احتمالاً متوجه سپرهایی با نوار قرمز رنگ زیر لوگو شده اند. این بدان معنی است که محصول حاوی اجزای آمریکایی نیست. این دوره رسمی هواوی است - انتقال به اجزای تولید خود، یا در هر صورت، تولید شده در کشورهایی که از سیاست ایالات متحده پیروی نمی کنند.
در اینجا چیزی است که می توانید روی خود برد کنترلر ببینید.
- رابط شبکه جهانی (تراشه Hisilicon 1822) مسئول اتصال به کانال فیبر یا اترنت.
- ارائه دسترسی از راه دور به تراشه BMC سیستم، یعنی Hisilicon 1710، برای کنترل از راه دور و نظارت کامل بر سیستم. موارد مشابه نیز در سرورهای ما و در راه حل های دیگر استفاده می شود.
- واحد پردازش مرکزی که تراشه Kunpeng 920 بر اساس معماری ARM ساخته شده توسط هواوی است. این اوست که در نمودار بالا نشان داده شده است، اگرچه سایر کنترلرها ممکن است مدل های مختلفی با تعداد هسته های مختلف، سرعت کلاک متفاوت و غیره داشته باشند. تعداد پردازنده های یک کنترلر نیز از مدلی به مدل دیگر تغییر می کند. به عنوان مثال، در سری قدیمی تر Dorado V6، چهار مورد از آنها در یک برد وجود دارد.
- کنترلر SSD (تراشه Hisilicon 1812e) که از هر دو درایو SAS و NVMe پشتیبانی می کند. علاوه بر این، هوآوی به طور مستقل درایوهای SSD تولید میکند، اما سلولهای NAND را خود تولید نمیکند و ترجیح میدهد آنها را از چهار تولیدکننده بزرگ جهان به شکل ویفرهای سیلیکونی برش نخورده خریداری کند. برش، آزمایش و بسته بندی در تراشه هایی که هوآوی به طور مستقل تولید می کند و پس از آن آنها را با نام تجاری خود عرضه می کند.
- تراشه هوش مصنوعی Ascend 310 است. به طور پیش فرض، روی کنترلر وجود ندارد و از طریق یک کارت جداگانه نصب می شود که یکی از اسلات های رزرو شده برای آداپتورهای شبکه را اشغال می کند. این تراشه برای ارائه رفتار حافظه پنهان هوشمند، مدیریت عملکرد یا فرآیندهای تکراری و فشرده سازی استفاده می شود. همه این وظایف را می توان با کمک پردازنده مرکزی حل کرد، اما تراشه هوش مصنوعی به شما این امکان را می دهد که این کار را بسیار کارآمدتر انجام دهید.
به طور جداگانه در مورد پردازنده های Kunpeng
پردازنده Kunpeng یک سیستم بر روی یک تراشه (SoC) است که در آن علاوه بر واحد محاسباتی، ماژولهای سختافزاری وجود دارد که فرآیندهای مختلف مانند محاسبه جمعهای چک یا اجرای کدگذاری پاکسازی را تسریع میکنند. همچنین پشتیبانی سختافزاری برای SAS، Ethernet، DDR4 (از شش تا هشت کانال) و غیره را اجرا میکند. همه اینها به Huawei اجازه میدهد تا کنترلکنندههای ذخیرهسازی را ایجاد کند که از نظر عملکرد کمتر از راهحلهای کلاسیک اینتل نیستند.
علاوه بر این، راهحلهای اختصاصی مبتنی بر معماری ARM، هوآوی را قادر میسازد تا راهحلهای سرور کاملی ایجاد کند و به عنوان جایگزینی برای x86 به مشتریان خود ارائه دهد.
معماری جدید Dorado V6…
معماری داخلی سیستم ذخیره سازی Dorado V6 سری قدیمی تر توسط چهار زیر دامنه اصلی (کارخانه ها) نشان داده شده است.
اولین کارخانه یک فرانت اند معمولی است (واسط های شبکه مسئول ارتباط با کارخانه SAN یا هاست).
دومی مجموعهای از کنترلکنندهها است که هر کدام از آنها میتوانند از طریق پروتکل RDMA هم به هر کارت شبکه جلویی و هم به «موتور» همسایه، که جعبهای با چهار کنترلر و همچنین قدرت و خنککننده است، «دسترسی» داشته باشند. واحدهای مشترک آنها اکنون مدلهای کلاس Hi-End Dorado V6 میتوانند به دو «موتور» (به ترتیب، هشت کنترلر) مجهز شوند.
کارخانه سوم مسئول backend است و از کارت های شبکه RDMA 100G تشکیل شده است.
در نهایت، کارخانه چهارم "در سخت افزار" با قفسه های ذخیره سازی هوشمند پلاگین نشان داده شده است.
این ساختار متقارن پتانسیل کامل فناوری NVMe را آزاد می کند و عملکرد و قابلیت اطمینان بالا را تضمین می کند. فرآیند I/O حداکثر در بین پردازندهها و هستهها موازی میشود و خواندن و نوشتن همزمان را برای چندین رشته فراهم میکند.
... و آنچه او به ما داد
حداکثر عملکرد راه حل های Dorado V6 تقریباً سه برابر بیشتر از سیستم های نسل قبلی (از همان کلاس) است و می تواند به 20 میلیون IOPS برسد.
این به این دلیل است که در نسل گذشته دستگاهها، پشتیبانی NVMe فقط به قفسههای کششی با درایوها گسترش مییابد. اکنون در تمام مراحل از هاست گرفته تا SSD وجود دارد. شبکه Backend نیز دستخوش تغییراتی شده است: SAS/PCIe جای خود را به RoCEv2 با توان عملیاتی 100 گیگابیت بر ثانیه داده است.
فرم فاکتور SSD نیز تغییر کرده است. اگر قبلاً 2 درایو در هر قفسه 25U وجود داشت، اکنون به 36 دیسک فیزیکی به اندازه کف دست رسیده است. علاوه بر این، قفسه ها "عاقلانه تا". هر یک از آنها اکنون دارای یک سیستم تحمل خطا از دو کنترل کننده مبتنی بر تراشه های ARM هستند، مشابه آنچه در کنترلرهای مرکزی نصب شده است.
آنها تاکنون فقط به سازماندهی مجدد داده ها مشغول هستند، اما با انتشار فریمور جدید، کدگذاری فشرده سازی و پاکسازی به آن اضافه می شود که بار کنترل کننده های اصلی را از 15 به 5 درصد کاهش می دهد. انتقال همزمان برخی کارها به قفسه، پهنای باند شبکه داخلی را آزاد می کند. و همه اینها به طور قابل توجهی پتانسیل مقیاس پذیری سیستم را افزایش می دهد.
فشرده سازی و حذف مجدد در سیستم ذخیره سازی نسل قبل با بلوک های با طول ثابت انجام شد. اکنون یک حالت کار با بلوک های با طول متغیر اضافه شده است که تا کنون باید به اجبار روشن شود. به روز رسانی های بعدی ممکن است این شرایط را تغییر دهد.
همچنین به طور خلاصه در مورد تحمل شکست. اگر یکی از دو کنترلر از کار بیفتد، Dorado V3 همچنان عملیاتی می شود. Dorado V6 در دسترس بودن داده ها را تضمین می کند حتی اگر از هر هشت کنترلر هفت کنترلر متوالی یا چهار موتور از یک موتور به طور همزمان از کار بیفتند.
قابلیت اطمینان از نظر اقتصادی
اخیراً نظرسنجی در میان مشتریان هواوی در مورد میزان خرابی عناصر تکی زیرساخت فناوری اطلاعات توسط این شرکت انجام شده است. در بیشتر موارد، پاسخ دهندگان در برابر یک موقعیت فرضی که در آن برنامه در عرض چند صد ثانیه پاسخ نمی دهد، تحمل می کردند. برای سیستم عامل یا آداپتور باس میزبان، دهها ثانیه (در اصل زمان راهاندازی مجدد) زمان قطعی حیاتی بود. مشتریان حتی تقاضاهای بیشتری را در شبکه ایجاد می کنند: پهنای باند آن نباید بیش از 10-20 ثانیه ناپدید شود. همانطور که ممکن است حدس بزنید، مهم ترین پاسخ دهندگان، خرابی سیستم ذخیره سازی را در نظر گرفتند. از دیدگاه نمایندگان کسب و کار، ذخیره سازی ساده نباید بیش از ... چند ثانیه در سال باشد!
به عبارت دیگر، اگر درخواست مشتری بانک به مدت 100 ثانیه پاسخ ندهد، به احتمال زیاد عواقب فاجعه باری در پی نخواهد داشت. اما اگر سیستم ذخیره سازی به همان میزان کار نکند، احتمال توقف کسب و کار و ضررهای مالی قابل توجه وجود دارد.
نمودار بالا هزینه یک ساعت کار را برای ده بانک بزرگ نشان می دهد (داده های فوربس برای سال 2017). موافقم، اگر شرکت شما به اندازه بانک های چینی نزدیک می شود، توجیه نیاز به خرید سیستم های ذخیره سازی چند میلیون دلاری چندان دشوار نخواهد بود. گزاره برعکس نیز درست است: اگر یک کسب و کار در طول زمان خرابی متحمل ضررهای قابل توجهی نشود، بعید است که سیستم های ذخیره سازی پیشرفته خریداری کند. در هر صورت، مهم است که تصور کنید در زمانی که مدیر سیستم با سیستم ذخیرهسازی که از کار کردن خودداری کرده است، چه اندازه سوراخی در کیف پول شما ایجاد میشود، مهم است.
دوم در هر شکست
در راه حل A در تصویر بالا، می توانید نسل قبلی سیستم Dorado V3 ما را بشناسید. چهار کنترلر آن به صورت جفت کار می کنند و تنها دو کنترلر حاوی کپی از کش هستند. کنترلرهای درون یک جفت می توانند بار را دوباره توزیع کنند. در عین حال، همانطور که می بینید، در اینجا هیچ "کارخانه" front-end و back-end وجود ندارد، بنابراین هر یک از قفسه های ذخیره سازی به یک جفت کنترلر خاص متصل می شوند.
نمودار راه حل B راه حلی را نشان می دهد که در حال حاضر در بازار از فروشنده دیگری (تشخیص داده شده است؟) وجود دارد. در اینجا قبلاً کارخانه های جلویی و بک اند وجود دارد و درایوها به طور همزمان به چهار کنترلر متصل می شوند. درست است، تفاوت های ظریف وجود دارد که در اولین تقریب در کار الگوریتم های داخلی سیستم آشکار نیست.
در سمت راست معماری فضای ذخیره سازی Dorado V6 فعلی ما با مجموعه کاملی از قطعات داخلی است. در نظر بگیرید که چگونه این سیستم ها در یک موقعیت معمولی - شکست یک کنترل کننده - زنده می مانند.
در سیستم های کلاسیک که شامل Dorado V3 می شود، مدت زمان لازم برای توزیع مجدد بار در صورت خرابی به چهار ثانیه می رسد. در این مدت، I/O به طور کامل متوقف می شود. راه حل B از همکاران ما، علیرغم معماری مدرن تر، از خرابی شش ثانیه حتی بیشتر است.
Storage Dorado V6 کار خود را تنها در یک ثانیه پس از خرابی بازیابی می کند. این نتیجه به لطف یک محیط RDMA داخلی همگن به دست می آید که به کنترل کننده اجازه دسترسی به حافظه "خارجی" را می دهد. دومین شرایط مهم وجود یک کارخانه جلویی است که به لطف آن مسیر میزبان تغییر نمی کند. پورت ثابت می ماند و بار به سادگی توسط درایورهای چند گذری به کنترلرهای سالم ارسال می شود.
شکست دومین کنترلر در Dorado V6 طبق همان طرح در یک ثانیه حل می شود. Dorado V3 حدود شش ثانیه طول میکشد و راهحل فروشنده دیگر XNUMX ثانیه طول میکشد. برای بسیاری از DBMS ها، دیگر نمی توان چنین فواصل را قابل قبول در نظر گرفت، زیرا در این مدت سیستم به حالت آماده به کار تغییر می کند و کار را متوقف می کند. این اول از همه مربوط به DBMS است که از بخش های زیادی تشکیل شده است.
شکست سومین کنترلر راه حل A قادر به زنده ماندن نیست. صرفاً به این دلیل که دسترسی به بخشی از دیسک های داده از بین رفته است. به نوبه خود، راه حل B در چنین شرایطی ظرفیت کاری خود را بازیابی می کند، که مانند مورد قبلی، نه ثانیه طول می کشد.
Dorado V6 چیست؟ یک ثانیه.
کاری که می توان در یک ثانیه انجام داد
تقریباً هیچ، اما ما به آن نیاز نداریم. یک بار دیگر، در Dorado V6 از کلاس hi-end، کارخانه جلویی از کارخانه کنترل جدا شده است. این بدان معناست که هیچ پورت کدگذاری سختی متعلق به یک کنترلر خاص وجود ندارد. Failover شامل یافتن مسیرهای جایگزین یا شروع مجدد چند گذر نیست. این سیستم مانند گذشته به کار خود ادامه می دهد.
تحمل شکست چندگانه
مدلهای قدیمیتر Dorado V6 میتوانند به راحتی از خرابی همزمان هر دو (!) کنترلر از هر "موتور" جان سالم به در ببرند. این با این واقعیت امکان پذیر است که راه حل اکنون سه نسخه از حافظه پنهان را نگه می دارد. بنابراین، حتی با یک شکست مضاعف، همیشه یک نسخه کامل وجود خواهد داشت.
خرابی همزمان هر چهار کنترل کننده در یکی از "موتورها" نیز عواقب مرگباری ایجاد نمی کند، زیرا هر سه نسخه کش در هر زمان در بین "موتورها" توزیع می شوند. خود سیستم بر انطباق با چنین منطق کار نظارت می کند.
در نهایت، یک سناریوی بسیار بعید، خرابی متوالی هفت کنترلر از هشت کنترلر است. علاوه بر این، حداقل فاصله مجاز برای حفظ عملکرد بین خرابی های فردی 15 دقیقه است. در این مدت، سیستم ذخیره سازی زمان دارد تا عملیات لازم برای انتقال حافظه پنهان را انجام دهد.
آخرین کنترلر باقیمانده ذخیره اطلاعات را اجرا می کند و کش را به مدت پنج روز حفظ می کند (مقدار پیش فرض که به راحتی در تنظیمات قابل تغییر است). پس از آن، حافظه پنهان غیرفعال می شود، اما سیستم ذخیره سازی به کار خود ادامه می دهد.
به روز رسانی های بدون مزاحمت
سیستم عامل جدید Dorado V6 به شما این امکان را می دهد که سیستم عامل ذخیره سازی را بدون راه اندازی مجدد کنترلرها به روز کنید.
سیستم عامل، مانند راه حل های قبلی، مبتنی بر لینوکس است، با این حال، بسیاری از فرآیندهای عملیاتی از هسته به حالت کاربر منتقل شده اند. بسیاری از توابع، مانند آنهایی که مسئول deduplication و فشرده سازی هستند، اکنون شبح های معمولی هستند که در پس زمینه اجرا می شوند. در نتیجه، نیازی به تغییر کل سیستم عامل برای به روز رسانی تک تک ماژول ها نیست. فرض کنید، برای اضافه کردن پشتیبانی از یک پروتکل جدید، فقط باید ماژول نرم افزار مربوطه را خاموش کنید و یک پروتکل جدید را شروع کنید.
واضح است که مسائل مربوط به به روز رسانی سیستم به طور کلی همچنان باقی است، زیرا ممکن است عناصری در هسته وجود داشته باشند که باید به روز شوند. اما آن ها، طبق مشاهدات ما، کمتر از 6 درصد از کل هستند. این به شما امکان می دهد کنترلرها را ده برابر کمتر از قبل راه اندازی مجدد کنید.
راه حل های مقاوم در برابر بلایا و در دسترس بودن بالا (HA/DR).
Dorado V6 خارج از جعبه آماده ادغام در راه حل های جغرافیایی توزیع شده، خوشه های سطح شهر (مترو) و مراکز داده "سه گانه" است.
در سمت چپ در تصویر بالا یک خوشه مترو از قبل برای بسیاری آشنا است. دو سیستم ذخیره سازی در حالت فعال / فعال در فاصله تا 100 کیلومتر از یکدیگر کار می کنند. چنین زیرساختی با یک یا چند سرور حد نصاب می تواند توسط راه حل های شرکت های مختلف، از جمله سیستم عامل ابری FusionSphere ما پشتیبانی شود. ویژگی های کانال بین سایت ها از اهمیت ویژه ای در چنین پروژه هایی برخوردار است ، همه وظایف دیگر در مورد ما توسط عملکرد HyperMetro انجام می شود ، دوباره خارج از جعبه موجود است. در صورت بروز چنین نیازی، یکپارچه سازی از طریق کانال فیبر و همچنین از طریق iSCSI در شبکه های IP امکان پذیر است. دیگر نیازی به حضور اجباری اپتیک "تاریک" اختصاصی نیست، زیرا سیستم قادر به برقراری ارتباط از طریق کانال های موجود است.
هنگام ساخت چنین سیستم هایی، تنها نیاز سخت افزاری برای ذخیره سازی، تخصیص پورت ها برای تکرار است. کافی است لایسنس خریداری کنید، سرورهای حد نصابی - فیزیکی یا مجازی - را اجرا کنید و اتصال IP به کنترلرها (10 مگابیت در ثانیه، 50 میلی ثانیه) ارائه دهید.
این معماری را می توان به راحتی به سیستمی با سه مرکز داده منتقل کرد (به سمت راست تصویر مراجعه کنید). به عنوان مثال، زمانی که دو مرکز داده در حالت خوشه مترو کار می کنند، و سایت سوم که در فاصله بیش از 100 کیلومتر قرار دارد، از تکرار ناهمزمان استفاده می کند.
این سیستم از نظر فن آوری از سناریوهای تجاری مختلفی پشتیبانی می کند که در صورت افزایش در مقیاس بزرگ اجرا می شوند.
بقای یک خوشه مترو با خرابی های متعدد
موارد بالا و زیر همچنین یک کلاستر مترو را نشان می دهد که از دو سیستم ذخیره سازی و یک سرور حد نصاب تشکیل شده است. همانطور که می بینید، در شش مورد از XNUMX سناریوی احتمالی خرابی های متعدد، زیرساخت های ما عملیاتی می شوند.
به عنوان مثال، در سناریوی دوم، اگر سرور حد نصاب از کار بیفتد و همگام سازی بین سایت ها از کار بیفتد، سیستم سازنده باقی می ماند زیرا سایت دوم کار نمی کند. این رفتار قبلاً در الگوریتم های داخلی تعبیه شده است.
حتی پس از سه شکست، اگر فاصله بین آنها حداقل 15 ثانیه باشد، می توان دسترسی به اطلاعات را حفظ کرد.
برگ برنده معمولی از آستین
به یاد بیاورید که هواوی نه تنها سیستم های ذخیره سازی، بلکه طیف کاملی از تجهیزات شبکه را نیز تولید می کند. هر کدام از ارائهدهنده ذخیرهسازی را انتخاب کنید، اگر از شبکه WDM بین سایتها استفاده شود، در ۹۰ درصد موارد بر اساس راهحلهای شرکت ما ساخته میشود. یک سوال منطقی مطرح می شود: چرا یک باغ وحش از سیستم ها جمع آوری می شود در حالی که تمام سخت افزارهایی که تضمین شده است با یکدیگر سازگار هستند را می توان از یک فروشنده تهیه کرد؟
به سوال عملکرد
احتمالاً هیچ کس لازم نیست متقاعد شود که انتقال به ذخیره سازی All-Flash می تواند هزینه های تعمیر و نگهداری زیرساخت را به میزان قابل توجهی کاهش دهد، زیرا همه عملیات های معمول چندین برابر سریعتر انجام می شوند. همه تامین کنندگان چنین تجهیزاتی بر این امر گواهی می دهند. در همین حال، بسیاری از فروشندگان در هنگام فعال کردن حالتهای ذخیرهسازی مختلف، شروع به حیلهگری در مورد کاهش عملکرد میکنند.
در صنعت ما، صدور سیستم های ذخیره سازی برای عملیات آزمایشی برای یک یا دو روز به طور گسترده انجام می شود. فروشنده یک آزمایش 20 دقیقه ای را روی یک سیستم خالی انجام می دهد و ارقام عملکرد کیهانی را به دست می آورد. و در عملیات واقعی، "چنگک های زیر آب" به سرعت به بیرون می خزند. پس از یک روز، مقادیر زیبای IOPS به نصف یا سه برابر کاهش می یابد و اگر سیستم ذخیره سازی 80٪ پر شود، حتی کمتر می شود. هنگامی که RAID 5 به جای RAID 10 فعال می شود، 10-15٪ دیگر از بین می رود و در حالت کلاستر مترو، عملکرد به نصف کاهش می یابد.
همه موارد ذکر شده در بالا در مورد Dorado V6 نیست. مشتریان ما این فرصت را دارند که در آخر هفته یا حداقل یک شبه تست عملکرد را اجرا کنند. سپس جمع آوری زباله خود را نشان می دهد و همچنین مشخص می شود که چگونه فعال سازی گزینه های مختلف - مانند عکس های فوری و تکرار - بر میزان IOPS به دست آمده تأثیر می گذارد.
در Dorado V6، عکس های فوری و RAID با برابری تقریباً هیچ تأثیری بر عملکرد ندارند (3-5٪ به جای 10-15٪). جمعآوری زباله (پر کردن سلولهای درایو با صفر)، فشردهسازی، حذف مجدد روی یک سیستم ذخیرهسازی که 80 درصد پر است، همیشه بر سرعت کلی پردازش درخواست تأثیر میگذارد. اما این Dorado V6 است که از این نظر جالب است که مهم نیست که چه ترکیبی از عملکردها و مکانیسم های محافظتی را فعال کنید، عملکرد ذخیره سازی نهایی از 80٪ رقم به دست آمده بدون بار پایین نمی آید.
تعادل بار
عملکرد بالای Dorado V6 با ایجاد تعادل در هر مرحله به دست می آید، یعنی:
- چند گذر؛
- استفاده از اتصالات متعدد از یک میزبان؛
- در دسترس بودن یک کارخانه جلویی؛
- موازی سازی عملکرد کنترل کننده های ذخیره سازی؛
- توزیع بار در تمام درایوها در سطح RAID 2.0+.
اساساً این یک رویه رایج است. این روزها، افراد کمی همه داده ها را روی یک LUN نگه می دارند: همه سعی می کنند هشت، حتی چهل یا حتی بیشتر داشته باشند. این یک رویکرد بدیهی و درست است که ما در آن شریک هستیم. اما اگر وظیفه شما فقط به یک LUN نیاز دارد که نگهداری آن آسانتر است، راهحلهای معماری ما به آن اجازه میدهد تا 80 درصد عملکرد موجود با چندین LUN را به دست آورد.
برنامه ریزی پویا CPU
توزیع بار روی پردازنده ها هنگام استفاده از یک LUN به روش زیر اجرا می شود: وظایف در سطح LUN به "شاردهای کوچک" جداگانه تقسیم می شوند که هر یک به طور سفت و سخت به یک کنترل کننده خاص در "موتور" اختصاص داده می شود. این کار به گونه ای انجام می شود که سیستم عملکرد خود را در حین "پرش" با این قطعه داده در کنترلرهای مختلف از دست ندهد.
مکانیزم دیگر برای حفظ کارایی بالا، زمانبندی پویا است که در آن هستههای پردازنده خاصی را میتوان به مجموعههای مختلف وظایف اختصاص داد. به عنوان مثال، اگر سیستم در حال حاضر در سطح deduplication و فشرده سازی بیکار باشد، ممکن است برخی از هسته ها در روند سرویس دهی I / O دخیل باشند. یا برعکس. همه اینها به صورت خودکار و شفاف برای کاربر انجام می شود.
اطلاعات مربوط به بار فعلی هر یک از هسته های Dorado V6 در رابط گرافیکی نمایش داده نمی شود، اما از طریق خط فرمان می توانید به سیستم عامل کنترلر دسترسی داشته باشید و از دستور معمول لینوکس استفاده کنید. بالا.
پشتیبانی از NVMe و RoCE
همانطور که قبلا ذکر شد، Dorado V6 در حال حاضر به طور کامل از NVMe روی کانال فیبر پشتیبانی می کند و به هیچ مجوزی نیاز ندارد. در اواسط سال، پشتیبانی از NVMe از طریق حالت اترنت ظاهر می شود. برای استفاده کامل از اترنت با دسترسی مستقیم به حافظه (DMA) نسخه 2.0 هم از طریق خود سیستم ذخیره سازی و هم از سوییچ ها و آداپتورهای شبکه نیاز دارید. به عنوان مثال، مانند Mellanox ConnectX-4 یا ConnectX-5. شما همچنین می توانید از کارت های شبکه ساخته شده بر اساس تراشه های ما استفاده کنید. همچنین پشتیبانی RoCE باید در سطح سیستم عامل پیاده سازی شود.
به طور کلی، ما Dorado V6 را یک سیستم NVMe محور میدانیم. علیرغم پشتیبانی موجود از کانال فیبر و iSCSI، در آینده برنامه ریزی شده است که به اترنت پرسرعت با RDMA سوئیچ شود.
کمی بازاریابی
با توجه به این واقعیت که سیستم Dorado V6 بسیار مقاوم در برابر خطا است، به خوبی مقیاس پذیر است، از فناوری های مختلف مهاجرت و غیره پشتیبانی می کند، تأثیر اقتصادی کسب آن با شروع استفاده فشرده از سیستم های ذخیره سازی آشکار می شود. ما به تلاش خود ادامه خواهیم داد تا مالکیت سیستم را تا حد امکان سودآور کنیم، حتی اگر در مرحله اول مشهود نباشد.
به طور خاص، ما برنامه FLASH EVER را تشکیل دادهایم که با افزایش چرخه عمر سیستمهای ذخیرهسازی مرتبط است و به گونهای طراحی شده است که مشتری را تا حد امکان در طول ارتقاء تخلیه کند.
این برنامه شامل تعدادی از اقدامات است:
- امکان جایگزینی تدریجی کنترلرها و قفسه های دیسک با نسخه های جدید بدون جایگزینی کل سخت افزار (برای سیستم های پیشرفته Dorado V6).
- امکان ذخیره سازی فدرال (ترکیب نسخه های مختلف Dorado به عنوان بخشی از یک خوشه ذخیره سازی هیبریدی)؛
- مجازی سازی هوشمند (توانایی استفاده از سخت افزار شخص ثالث به عنوان بخشی از راه حل Dorado).
باید توجه داشت که وضعیت دشوار جهان تأثیر چندانی بر چشم انداز تجاری سیستم جدید نداشت. علیرغم این واقعیت که عرضه رسمی Dorado V6 تنها در ژانویه انجام شد، ما شاهد تقاضای قابل توجهی برای آن در چین و همچنین علاقه زیادی از طرف شرکای روسی و بین المللی از بخش های مالی و دولتی به آن هستیم.
از جمله، در ارتباط با بیماری همه گیر، مهم نیست که چقدر طول بکشد، موضوع ارائه کارمندان از راه دور به دسکتاپ مجازی به ویژه حاد است. در این فرآیند، Dorado V6 همچنین می تواند بسیاری از سوالات را حذف کند. برای این منظور، ما تمام تلاش خود را انجام می دهیم، از جمله توافق عملی در مورد گنجاندن سیستم جدید در لیست سازگاری VMware.
***
به هر حال، وبینارهای متعدد ما را فراموش نکنید که نه تنها در بخش روسی زبان، بلکه در سطح جهانی نیز برگزار می شود. لیست وبینارهای ماه آوریل در دسترس است
منبع: www.habr.com