با معماری Shared Nothing خطرات خرابی را کاهش دهید

موضوع تحمل خطا در سیستم‌های ذخیره‌سازی داده‌ها همیشه مرتبط است، زیرا در عصر مجازی‌سازی گسترده و یکپارچه‌سازی منابع، سیستم‌های ذخیره‌سازی پیوندی هستند که خرابی آنها نه تنها به یک حادثه معمولی، بلکه به از کار افتادن طولانی‌مدت خدمات منجر می‌شود. بنابراین، سیستم‌های ذخیره‌سازی مدرن شامل بسیاری از اجزای تکراری (حتی کنترل‌کننده‌ها) هستند. اما آیا چنین حفاظتی کافی است؟

با معماری Shared Nothing خطرات خرابی را کاهش دهید

کاملاً همه فروشندگان، هنگام فهرست کردن ویژگی‌های سیستم‌های ذخیره‌سازی، همیشه به تحمل خطای بالای راه‌حل‌های خود اشاره می‌کنند و همیشه عبارت «بدون یک نقطه خرابی» را اضافه می‌کنند. بیایید نگاهی دقیق تر به یک سیستم ذخیره سازی معمولی بیندازیم. برای جلوگیری از خرابی در تعمیر و نگهداری، سیستم ذخیره‌سازی منابع تغذیه، ماژول‌های خنک‌کننده، پورت‌های ورودی/خروجی، درایوها (منظورمان RAID) و البته کنترل‌کننده‌ها را کپی می‌کند. اگر با دقت به این معماری نگاه کنید، حداقل دو نقطه بالقوه شکست را متوجه خواهید شد که به طور متواضعانه سکوت می کنند:

  1. در دسترس بودن یک هواپیمای پشتی
  2. داشتن یک کپی از داده ها

هواپیمای پشتی یک وسیله فنی پیچیده است که باید در حین تولید مورد آزمایش جدی قرار گیرد. و بنابراین، موارد بسیار نادری وجود دارد که به طور کامل از کار می افتد. با این حال، حتی در صورت بروز مشکلات جزئی، مانند شکاف درایو ناکارآمد، باید با خاموش شدن کامل سیستم ذخیره سازی جایگزین شود.

ایجاد چندین نسخه از داده ها نیز در نگاه اول مشکلی نیست. به عنوان مثال، عملکرد Clone در سیستم های ذخیره سازی، که به شما امکان می دهد یک نسخه کامل از داده ها را در فواصل زمانی به روز کنید، بسیار گسترده است. با این حال، در صورت بروز مشکل در همان بک پلی، کپی به اندازه نسخه اصلی در دسترس نخواهد بود.

یک راه حل کاملا واضح برای غلبه بر این کاستی ها، تکرار به یک سیستم ذخیره سازی دیگر است. اگر چشمان خود را بر دو برابر شدن هزینه سخت افزاری که انتظار می رود ببندیم (هنوز فرض می کنیم افرادی که چنین تصمیمی را انتخاب می کنند به اندازه کافی فکر می کنند و از قبل این واقعیت را می پذیرند)، همچنان هزینه های احتمالی برای سازماندهی تکرار در قالب مجوزها وجود خواهد داشت. نرم افزار و سخت افزار. و مهمتر از همه، شما باید به نحوی از سازگاری داده های تکراری اطمینان حاصل کنید. آن ها یک مجازی ساز ذخیره سازی/vSAN/و غیره بسازید که به پول و منابع زمانی نیز نیاز دارد.

AccelStor هنگام ایجاد سیستم‌های با دسترسی بالا، هدفی را برای خلاصی از کاستی‌های ذکر شده در بالا تعیین می‌کنیم. اینگونه بود که تفسیر فناوری Shared Nothing ظاهر شد، که ترجمه آن به معنای "بدون استفاده از دستگاه های مشترک" است.

مفهوم چیزی به اشتراک گذاشته نشد معماری نشان دهنده استفاده از دو گره مستقل (کنترل کننده) است که هر کدام مجموعه ای از داده های خاص خود را دارند. همانندسازی همزمان بین گره ها از طریق رابط InfiniBand 56G رخ می دهد که کاملاً برای نرم افزار در حال اجرا در بالای سیستم ذخیره سازی شفاف است. در نتیجه استفاده از مجازی سازهای ذخیره سازی، عامل های نرم افزاری و غیره مورد نیاز نیست.

از نظر فیزیکی، راه حل دو گره AccelStor را می توان در دو مدل پیاده سازی کرد:

  • H510 - بر اساس سرورهای دوقلو در یک کیس 2U، در صورت نیاز به عملکرد متوسط ​​و ظرفیت تا 22 ترابایت؛
  • H710 - بر اساس سرورهای جداگانه 2U، در صورت نیاز به عملکرد بالا و ظرفیت زیاد (تا 57 ترابایت).

با معماری Shared Nothing خطرات خرابی را کاهش دهید

مدل H510 مبتنی بر سرور دوقلو

با معماری Shared Nothing خطرات خرابی را کاهش دهید

مدل H710 بر اساس سرورهای فردی

استفاده از فاکتورهای فرم مختلف به دلیل نیاز به تعداد متفاوت SSD برای دستیابی به حجم و کارایی معین است. به علاوه، پلتفرم دوقلو ارزان‌تر است و به شما امکان می‌دهد راه‌حل‌های مقرون‌به‌صرفه‌تری را ارائه دهید، البته با برخی «مضرات» مشروط به شکل یک هواپیمای پشتی. سایر موارد، از جمله اصول عملکرد، برای هر دو مدل کاملاً یکسان است.

مجموعه داده برای هر گره دارای دو گروه است FlexiRemap، به علاوه 2 یدکی داغ. هر گروه قادر است در برابر شکست یک SSD مقاومت کند. تمام درخواست های دریافتی برای ثبت یک گره مطابق با ایدئولوژی FlexiRemap بلوک‌های 4 کیلوبایتی را به زنجیره‌های متوالی بازسازی می‌کند، که سپس در راحت‌ترین حالت برای آنها (ضبط متوالی) روی SSD نوشته می‌شود. علاوه بر این، میزبان تنها پس از قرار گرفتن فیزیکی داده ها بر روی SSD، تأیید ضبط دریافت می کند. بدون کش در رم نتیجه عملکرد بسیار چشمگیر تا 600K نوشتن IOPS و خواندن 1M+ IOPS (مدل H710) است.

همانطور که قبلا ذکر شد، مجموعه داده ها در زمان واقعی از طریق رابط InfiniBand 56G، که دارای توان عملیاتی بالا و تاخیر کم است، همگام می شوند. به منظور استفاده بهینه از کانال ارتباطی هنگام ارسال بسته های کوچک. زیرا تنها یک کانال ارتباطی وجود دارد؛ یک لینک اختصاصی 1GbE برای بررسی ضربان قلب اضافی استفاده می شود. فقط ضربان قلب از طریق آن منتقل می شود، بنابراین هیچ الزامی برای ویژگی های سرعت وجود ندارد.

در صورت افزایش ظرفیت سیستم (تا 400+TB) به دلیل قفسه های گسترش آنها همچنین به صورت جفت به هم متصل می شوند تا مفهوم "هیچ نقطه شکست" را حفظ کنند.

برای محافظت از داده های اضافی (علاوه بر این واقعیت که AccelStor قبلاً دو نسخه دارد)، در صورت خرابی هر SSD از یک الگوریتم رفتار ویژه استفاده می شود. اگر SSD خراب شود، گره شروع به بازسازی داده ها روی یکی از درایوهای یدکی داغ می کند. گروه FlexiRemap که در حالت تخریب قرار دارد به حالت فقط خواندن تغییر می کند. این کار برای از بین بردن تداخل بین عملیات نوشتن و بازسازی روی دیسک پشتیبان انجام می شود که در نهایت روند بازیابی را سرعت می بخشد و زمان آسیب پذیری بالقوه سیستم را کاهش می دهد. پس از اتمام بازسازی، گره به حالت عادی خواندن و نوشتن باز می گردد.

با معماری Shared Nothing خطرات خرابی را کاهش دهید

البته، مانند سایر سیستم ها، در طول بازسازی، عملکرد کلی کاهش می یابد (به هر حال، یکی از گروه های FlexiRemap برای ضبط کار نمی کند). اما فرآیند بازیابی به خودی خود در سریع ترین زمان ممکن اتفاق می افتد، که سیستم های AccelStor را از راه حل های فروشندگان دیگر متمایز می کند.

یکی دیگر از ویژگی های مفید فناوری معماری Nothing Shared، عملکرد گره ها در حالت به اصطلاح واقعی فعال-اکتیو است. برخلاف معماری "کلاسیک"، که در آن تنها یک کنترلر دارای یک حجم/پول خاص است و دومی به سادگی عملیات I/O را در سیستم ها انجام می دهد. AccelStor هر گره با مجموعه ای از داده های خود کار می کند و درخواست ها را به "همسایه" خود ارسال نمی کند. در نتیجه، عملکرد کلی سیستم به دلیل پردازش موازی درخواست‌های ورودی/خروجی توسط گره‌ها و دسترسی به درایوها بهبود می‌یابد. همچنین عملاً چیزی به نام Failover وجود ندارد، زیرا در صورت خرابی به سادگی نیازی به انتقال کنترل حجم ها به گره دیگری نیست.

اگر فناوری معماری Nothing Shared را با تکرار سیستم ذخیره سازی تمام عیار مقایسه کنیم، در نگاه اول، نسبت به اجرای کامل بازیابی فاجعه در انعطاف پذیری کمی پایین تر خواهد بود. این امر به ویژه برای سازماندهی یک خط ارتباطی بین سیستم های ذخیره سازی صادق است. بنابراین، در مدل H710 می‌توان با استفاده از کابل‌های نوری نه چندان ارزان InfiniBand، گره‌ها را تا فاصله 100 متری پخش کرد. اما حتی اگر با اجرای معمول تکرار همزمان از سایر فروشندگان از طریق کانال فیبر موجود مقایسه شود، حتی در فواصل طولانی‌تر، راه‌حل AccelStor ارزان‌تر و آسان‌تر برای نصب/عمل خواهد بود، زیرا نیازی به نصب مجازی سازهای ذخیره سازی و/یا ادغام با نرم افزار نیست (که در اصل همیشه امکان پذیر نیست). به علاوه، فراموش نکنید که راه حل های AccelStor همه آرایه های فلش با عملکرد بالاتر از سیستم های ذخیره سازی "کلاسیک" فقط با SSD هستند.

با معماری Shared Nothing خطرات خرابی را کاهش دهید

هنگام استفاده از معماری Nothing Shared AccelStor، امکان دسترسی به سیستم ذخیره سازی 99.9999% با هزینه بسیار مناسب وجود دارد. همراه با قابلیت اطمینان بالای راه حل، از جمله از طریق استفاده از دو نسخه از داده ها، و عملکرد چشمگیر به لطف الگوریتم های اختصاصی FlexiRemap، راه حل هایی از AccelStor کاندیدای عالی برای موقعیت های کلیدی هنگام ساخت یک مرکز داده مدرن هستند.

منبع: www.habr.com

اضافه کردن نظر