Смањите ризик од застоја помоћу архитектуре Схаред Нотхинг

Тема толеранције грешака у системима за складиштење података је увек актуелна, јер у наше доба раширене виртуелизације и консолидације ресурса, системи за складиштење су карика чији квар ће довести не само до обичног удеса, већ и до дуготрајног застоја услуга. Због тога савремени системи за складиштење садрже много дуплираних компоненти (чак и контролера). Али да ли је таква заштита довољна?

Смањите ризик од застоја помоћу архитектуре Схаред Нотхинг

Апсолутно сви добављачи, када набрајају карактеристике система за складиштење података, увек помињу високу толеранцију грешака својих решења, увек додајући термин „без једне тачке квара“. Хајде да ближе погледамо типичан систем складиштења. Да би се избегао застој у одржавању, систем за складиштење дуплира изворе напајања, модуле за хлађење, улазне/излазне портове, дискове (мислимо на РАИД) и, наравно, контролере. Ако пажљиво погледате ову архитектуру, приметићете најмање две потенцијалне тачке неуспеха, које се скромно прећуткују:

  1. Доступност једне задње плоче
  2. Имајући једну копију података

Задња плоча је технички сложен уређај који мора да прође озбиљна тестирања током производње. И стога, постоје изузетно ретки случајеви када потпуно не успе. Међутим, чак иу случају делимичних проблема, као што је слот за диск који не функционише, мораће да се замени потпуним гашењем система за складиштење података.

Прављење више копија података такође на први поглед није проблем. На пример, функционалност клонирања у системима за складиштење, која вам омогућава да ажурирате комплетну копију података у одређеним интервалима, прилично је распрострањена. Међутим, у случају проблема са истом позадином, копија ће бити једнако недоступна као и оригинал.

Потпуно очигледно решење за превазилажење ових недостатака је репликација на други систем складиштења. Ако затворимо очи пред очекиваним удвостручењем цене хардвера (и даље претпостављамо да људи који бирају такву одлуку адекватно размишљају и прихватају ову чињеницу унапред), и даље ће бити могући трошкови за организовање репликације у виду лиценци, додатних софтвер и хардвер. И што је најважније, мораћете некако да обезбедите доследност реплицираних података. Оне. направите виртуелизатор складиштења/вСАН/итд., што такође захтева новац и временске ресурсе.

АццелСтор Приликом креирања наших система високе доступности, поставили смо циљ да се ослободимо горе наведених недостатака. Тако се појавила интерпретација Схаред Нотхинг технологије, што у слободном преводу значи „без употребе дељених уређаја“.

Цонцепт Схаред Нотхинг архитектура представља коришћење два независна чвора (контролера), од којих сваки има свој скуп података. Синхрона репликација се дешава између чворова преко ИнфиниБанд 56Г интерфејса, потпуно транспарентног за софтвер који ради на врху система за складиштење података. Као резултат, није потребна употреба виртуелизатора складиштења, софтверских агената итд.

Физички, АццелСтор решење са два чвора може се имплементирати у два модела:

  • ХКСНУМКС — засновано на Твин серверима у кућишту од 2У, ако су потребне умерене перформансе и капацитет до 22ТБ;
  • ХКСНУМКС — на основу појединачних 2У сервера, ако су потребне високе перформансе и велики капацитет (до 57ТБ).

Смањите ризик од застоја помоћу архитектуре Схаред Нотхинг

Модел Х510 заснован на Твин серверу

Смањите ризик од застоја помоћу архитектуре Схаред Нотхинг

Модел Х710 заснован на појединачним серверима

Употреба различитих фактора форме је због потребе за различитим бројем ССД-ова да би се постигла дата запремина и перформансе. Поред тога, Твин платформа је јефтинија и омогућава вам да понудите приступачнија решења, иако са неким условним „недостацима“ у виду једне задње плоче. Све остало, укључујући принципе рада, потпуно је идентично за оба модела.

Скуп података за сваки чвор има две групе ФлекиРемап, плус 2 вруће резерве. Свака група је у стању да издржи квар једног ССД-а. Сви долазни захтеви за снимање чвора у складу са идеологија ФлекиРемап поново гради блокове од 4КБ у секвенцијалне ланце, који се затим уписују на ССД у најудобнијем режиму за њих (секвенцијално снимање). Штавише, хост добија потврду снимања тек након што су подаци физички смештени на ССД, тј. без кеширања у РАМ-у. Резултат су веома импресивне перформансе до 600К ИОПС уписивања и 1М+ ИОПС читања (модел Х710).

Као што је раније поменуто, скупови података се синхронизују у реалном времену преко ИнфиниБанд 56Г интерфејса, који има високу пропусност и ниско кашњење. У циљу што ефикаснијег коришћења комуникационог канала при преносу малих пакета. Јер постоји само један комуникациони канал за додатну проверу откуцаја срца; Преко њега се преноси само откуцај срца, тако да нема захтева за брзинске карактеристике.

У случају повећања капацитета система (до 400+ТБ) због експанзионе полице они су такође повезани у парове како би се одржао концепт „без једне тачке квара“.

За додатну заштиту података (поред чињенице да АццелСтор већ има две копије), користи се посебан алгоритам понашања у случају квара било ког ССД-а. Ако ССД поквари, чвор ће почети да обнавља податке на једном од резервних дискова. ФлекиРемап група, која је у деградираном стању, прећи ће у режим само за читање. Ово се ради како би се елиминисале сметње између операција писања и обнављања на резервном диску, што на крају убрзава процес опоравка и смањује време када је систем потенцијално рањив. По завршетку реконструкције, чвор се враћа у нормалан режим читања и писања.

Смањите ризик од застоја помоћу архитектуре Схаред Нотхинг

Наравно, као и други системи, током реконструкције укупне перформансе се смањују (на крају крајева, једна од ФлекиРемап група не ради за снимање). Али сам процес опоравка се одвија што је брже могуће, што разликује АццелСтор системе од решења других произвођача.

Још једно корисно својство технологије архитектуре Нотхинг Схаред је рад чворова у такозваном стварно активно-активном режиму. За разлику од „класичне“ архитектуре, где само један контролер поседује одређени волумен/пул, а други једноставно обавља И/О операције, у системима АццелСтор сваки чвор ради са сопственим скупом података и не преноси захтеве свом „суседу“. Као резултат тога, укупне перформансе система су побољшане због паралелне обраде И/О захтева од стране чворова и приступа дисковима. Такође практично не постоји таква ствар као што је прелазак на грешку, јер једноставно нема потребе да се пребацује контрола волумена на други чвор у случају квара.

Ако упоредимо технологију архитектуре Нотхинг Схаред са пуноправним дуплицирањем система за складиштење података, онда ће, на први поглед, бити мало инфериорнији у односу на пуну имплементацију опоравка од катастрофе у флексибилности. Ово посебно важи за организовање комуникационе линије између система за складиштење. Тако је у моделу Х710 могуће ширити чворове на удаљености до 100м коришћењем не баш јефтиних ИнфиниБанд активних оптичких каблова. Али чак и ако се упореди са уобичајеном имплементацијом синхроне репликације од других добављача преко доступног ФибреЦханнел-а, чак и на већим удаљеностима, решење из АццелСтор-а ће бити јефтиније и лакше за инсталирање/руковање, јер нема потребе за инсталирањем виртуелизатора складиштења и/или интеграцијом са софтвером (што у принципу није увек могуће). Осим тога, не заборавите да су АццелСтор решења Алл Фласх низови са већим перформансама од оних „класичних“ система за складиштење само са ССД-ом.

Смањите ризик од застоја помоћу архитектуре Схаред Нотхинг

Када се користи АццелСтор-ова Нотхинг Схаред архитектура, могуће је постићи 99.9999% доступности система за складиштење по веома разумној цени. Уз високу поузданост решења, укључујући коришћење две копије података, и импресивне перформансе захваљујући власничким алгоритмима ФлекиРемап, решења из АццелСтор су одлични кандидати за кључне позиције приликом изградње модерног дата центра.

Извор: ввв.хабр.цом

Додај коментар