Намалете рисковете от престой с архитектурата Shared Nothing

Темата за устойчивостта на грешки в системите за съхранение на данни винаги е актуална, тъй като в нашата епоха на широко разпространена виртуализация и консолидация на ресурси, системите за съхранение са връзката, чиято повреда ще доведе не само до обикновен инцидент, но и до дългосрочен престой на услугите. Следователно съвременните системи за съхранение съдържат много дублирани компоненти (дори контролери). Но достатъчна ли е такава защита?

Намалете рисковете от престой с архитектурата Shared Nothing

Абсолютно всички доставчици, когато изброяват характеристиките на системите за съхранение, винаги споменават високата отказоустойчивост на техните решения, като винаги добавят термина „без нито една точка на отказ“. Нека разгледаме по-отблизо типична система за съхранение. За да се избегне прекъсване на поддръжката, системата за съхранение дублира захранвания, охлаждащи модули, входно/изходни портове, дискове (имаме предвид RAID) и, разбира се, контролери. Ако се вгледате внимателно в тази архитектура, ще забележите поне две потенциални точки на провал, които скромно се премълчават:

  1. Наличие на единична задна платка
  2. Наличие на едно копие на данните

Backplane е технически сложно устройство, което трябва да бъде подложено на сериозни тестове по време на производството. И следователно има изключително редки случаи, когато той напълно се провали. Въпреки това, дори в случай на частични проблеми, като например неработещ слот за устройство, той ще трябва да бъде заменен с пълно изключване на системата за съхранение.

Създаването на множество копия на данни също не е проблем на пръв поглед. Например, функцията Clone в системите за съхранение, която ви позволява да актуализирате пълно копие на данни на определени интервали, е доста широко разпространена. Въпреки това, в случай на проблеми със същото възпроизвеждане, копието ще бъде също толкова недостъпно, колкото и оригинала.

Напълно очевидно решение за преодоляване на тези недостатъци е репликацията към друга система за съхранение. Ако затворим очите си за очакваното удвояване на цената на хардуера (все пак предполагаме, че хората, избиращи подобно решение, мислят адекватно и приемат този факт предварително), пак ще има възможни разходи за организиране на репликация под формата на лицензи, допълнителни софтуер и хардуер. И най-важното, ще трябва по някакъв начин да осигурите последователността на репликираните данни. Тези. изграждане на виртуализатор за съхранение/vSAN/и т.н., което също изисква пари и времеви ресурси.

AccelStor Когато създаваме нашите системи за висока достъпност, ние си поставихме за цел да се отървем от гореспоменатите недостатъци. Така се появи интерпретацията на технологията Shared Nothing, което в свободен превод означава „без използването на споделени устройства“.

Понятие Споделено нищо архитектурата представлява използването на два независими възела (контролери), всеки от които има собствен набор от данни. Синхронната репликация се осъществява между възлите чрез интерфейса InfiniBand 56G, напълно прозрачен за софтуера, работещ върху системата за съхранение. В резултат на това не се изисква използването на виртуализатори за съхранение, софтуерни агенти и т.н.

Физически, двувъзловото решение от AccelStor може да бъде реализирано в два модела:

  • H510 — базирани на Twin сървъри в корпус 2U, ако се изисква умерена производителност и капацитет до 22TB;
  • H710 — на базата на отделни 2U сървъри, ако се изисква висока производителност и голям капацитет (до 57TB).

Намалете рисковете от престой с архитектурата Shared Nothing

Модел H510 базиран на Twin сървър

Намалете рисковете от престой с архитектурата Shared Nothing

Модел H710, базиран на индивидуални сървъри

Използването на различни форм фактори се дължи на необходимостта от различен брой SSD за постигане на даден обем и производителност. Плюс това, платформата Twin е по-евтина и ви позволява да предлагате по-достъпни решения, макар и с някакъв условен „недостатък“ под формата на една задна платка. Всичко останало, включително и принципът на работа, е напълно идентичен и за двата модела.

Наборът от данни за всеки възел има две групи FlexiRemap, плюс 2 горещи резервни части. Всяка група е в състояние да издържи повреда на един SSD. Всички входящи заявки за запис на възел в съответствие с идеология FlexiRemap възстановява 4KB блокове в последователни вериги, които след това се записват на SSD в най-удобния за тях режим (последователен запис). Освен това хостът получава потвърждение за запис едва след като данните са физически поставени на SSD, т.е. без кеширане в RAM. Резултатът е много впечатляваща производителност до 600K IOPS запис и 1M+ IOPS четене (модел H710).

Както споменахме по-рано, наборите от данни се синхронизират в реално време чрез интерфейса InfiniBand 56G, който има висока пропускателна способност и ниска латентност. За да се използва максимално ефективно комуникационният канал при предаване на малки пакети. защото Има само един комуникационен канал; специална 1GbE връзка се използва за допълнителна проверка на пулса. Чрез него се предава само сърдечен ритъм, така че няма изисквания към скоростните характеристики.

В случай на увеличаване на капацитета на системата (до 400+TB) поради разширителни рафтове те също са свързани по двойки, за да поддържат концепцията „няма единична точка на отказ“.

За допълнителна защита на данните (в допълнение към факта, че AccelStor вече има две копия), се използва специален алгоритъм за поведение в случай на повреда на който и да е SSD. Ако SSD не успее, възелът ще започне да възстановява данните върху едно от горещите резервни устройства. Групата FlexiRemap, която е в деградирало състояние, ще премине в режим само за четене. Това се прави, за да се елиминират смущенията между операциите за запис и възстановяване на диска за архивиране, което в крайна сметка ускорява процеса на възстановяване и намалява времето, когато системата е потенциално уязвима. След завършване на възстановяването, възелът се връща към нормален режим на четене и запис.

Намалете рисковете от престой с архитектурата Shared Nothing

Разбира се, подобно на други системи, по време на възстановяването общата производителност намалява (в крайна сметка една от групите FlexiRemap не работи за запис). Но самият процес на възстановяване се случва възможно най-бързо, което отличава системите AccelStor от решенията на други доставчици.

Друго полезно свойство на технологията Nothing Shared architecture е работата на възлите в така наречения истински активен-активен режим. За разлика от „класическата“ архитектура, където само един контролер притежава конкретен том/пул, а вторият просто изпълнява I/O операции, в системите AccelStor всеки възел работи със собствен набор от данни и не предава заявки на своя „съсед“. В резултат на това цялостната производителност на системата се подобрява поради паралелната обработка на I/O заявки от възли и достъп до устройства. Също така на практика няма такова нещо като отказ, тъй като просто няма нужда да се прехвърля контролът върху обемите към друг възел в случай на повреда.

Ако сравним технологията на архитектурата Nothing Shared с пълноценно дублиране на система за съхранение, тогава на пръв поглед тя ще бъде малко по-ниска от пълното внедряване на възстановяване след авария по гъвкавост. Това важи особено за организирането на комуникационна линия между системите за съхранение. Така в модела H710 е възможно да се разпространяват възли на разстояние до 100 метра чрез използването на не много евтини активни оптични кабели InfiniBand. Но дори и в сравнение с обичайното внедряване на синхронна репликация от други доставчици чрез наличен FibreChannel, дори на по-големи разстояния, решението от AccelStor ще бъде по-евтино и по-лесно за инсталиране/работа, тъй като няма нужда от инсталиране на виртуализатори за съхранение и/или интегриране със софтуер (което по принцип не винаги е възможно). Освен това не забравяйте, че решенията AccelStor са All Flash масиви с производителност, по-висока от тази на „класическите“ системи за съхранение само със SSD.

Намалете рисковете от престой с архитектурата Shared Nothing

При използване на Nothing Shared архитектурата на AccelStor е възможно да се постигне 99.9999% наличност на системата за съхранение на много разумна цена. Заедно с високата надеждност на решението, включително чрез използването на две копия на данни, и впечатляващата производителност благодарение на патентовани алгоритми FlexiRemap, решения от AccelStor са отлични кандидати за ключови позиции при изграждането на модерен център за данни.

Източник: www.habr.com

Добавяне на нов коментар