AERODISK ENGINE N2 сақтау жүйесінің апаттық сынақтары, беріктік сынағы

AERODISK ENGINE N2 сақтау жүйесінің апаттық сынақтары, беріктік сынағы

Бәріңе сәлем! Осы мақаламен AERODISK Habre сайтында блог ашады. Уа, жолдастар!

Хабре туралы алдыңғы мақалалар сақтау жүйелерінің архитектурасы мен негізгі конфигурациясы туралы сұрақтарды талқылады. Бұл мақалада біз бұрын қарастырылмаған, бірақ жиі қойылатын сұрақты қарастырамыз - AERODISK ENGINE сақтау жүйелерінің ақауларға төзімділігі туралы. Біздің команда AERODISK сақтау жүйесінің жұмысын тоқтату үшін бәрін жасайды, яғни. бұзыңыз.

Біздің компанияның тарихы туралы, біздің өнімдеріміз туралы мақалалар, сондай-ақ табысты енгізудің мысалы туралы Хабреде ілулі тұрғаны белгілі болды. Біздің серіктестерімізге - TS Solution және Softline компанияларына үлкен рахмет.

Сондықтан мен мұнда көшіріп қоюды басқару дағдыларын үйретпеймін, бірақ жай ғана осы мақалалардың түпнұсқаларына сілтемелер беремін:

Мен де жақсы жаңалықпен бөліскім келеді. Бірақ мен, әрине, мәселеден бастаймын. Біз, жас сатушы ретінде, басқа шығындармен қатар, көптеген инженерлер мен әкімшілер біздің сақтау жүйемізді қалай дұрыс пайдалану керектігін білмейтіндігімен үнемі бетпе-бет келеміз.
Көптеген сақтау жүйелерін басқару әкімші тұрғысынан шамамен бірдей болып көрінетіні анық, бірақ әр өндірушінің өзіндік сипаттамалары бар. Және бұл жерде біз де ерекшелік емеспіз.

Сондықтан IT мамандарын дайындау міндетін жеңілдету үшін биылғы жылды тегін білім беруге арнауды жөн көрдік. Бұл үшін Ресейдің көптеген ірі қалаларында біз AERODISK құзырет орталықтарының желісін ашып жатырмыз, онда кез келген қызығушылық танытқан техникалық маман мүлдем тегін курстан өтіп, AERODISK ENGINE сақтау жүйелерін басқару сертификатын ала алады.

Әрбір құзіреттілік орталығында біз AERODISK сақтау жүйесінен толыққанды демо-стенд пен физикалық сервер орнатамыз, онда оқытушымыз бетпе-бет тренинг өткізеді. Біз құзырет орталықтарының жұмыс кестесін олар пайда болған кезде жариялайтын боламыз, бірақ біз Нижний Новгородта орталық аштық, ал келесіде Краснодар қаласы тұр. Төмендегі сілтемелер арқылы тренингке жазылуыңызға болады. Мұнда қалалар мен күндер туралы қазіргі уақытта белгілі ақпарат:

  • Нижний Новгород (БҰЗЫНАН АШЫҚ – осында тіркелуге болады https://aerodisk.promo/nn/);
    16 жылдың 2019 сәуіріне дейін орталыққа кез келген жұмыс уақытында келуге болады, ал 16 жылдың 2019 сәуірінде үлкен оқу курсы ұйымдастырылады.
  • Краснодар (ЖАҚЫНДА АШЫЛАДЫ - осында жазылуға болады https://aerodisk.promo/krsnd/ );
    9 жылдың 25 сәуірі мен 2019 сәуірі аралығында орталыққа кез келген жұмыс уақытында келуге болады, ал 25 жылдың 2019 сәуірінде үлкен оқу курсы ұйымдастырылады.
  • Екатеринбург (ЖАҚЫНДА АШЫЛАДЫ, біздің веб-сайттағы немесе Хабредегі ақпаратты қадағалаңыз);
    2019 жылғы мамыр-маусым.
  • Новосибирск (біздің веб-сайттағы немесе Habre сайтындағы ақпаратты қадағалаңыз);
    2019 жылдың қазаны.
  • Красноярск (біздің веб-сайттағы немесе Habre сайтындағы ақпаратты қадағалаңыз);
    Қараша 2019 ж

Және, әрине, егер Мәскеу сізден алыс емес болса, онда сіз кез келген уақытта Мәскеудегі кеңсемізге келіп, осындай дайындықтан өтуіңізге болады.

Барлық. Маркетингті бітірдік, технологияға көшейік!

Habré сайтында біз өз өнімдеріміз, жүктеме сынақтары, салыстырулар, пайдалану ерекшеліктері және қызықты енгізулер туралы техникалық мақалаларды үнемі жариялап отырамыз.

AERODISK ENGINE N2 сақтау жүйесінің апаттық сынақтары, беріктік сынағы

ЕСКЕРТУ! Мақаланы оқығаннан кейін сіз айта аласыз: жақсы, әрине, сатушы бәрі «жарылыспен» жұмыс істейтінін, жылыжай жағдайларын және т.б. Мен жауап беремін: ондай ештеңе жоқ! Шетелдік бәсекелестерімізден айырмашылығы, біз осында, сізге жақын жерде орналасқанбыз және сіз әрқашан бізге (Мәскеуде немесе кез келген Орталық Комитетте) келіп, біздің сақтау жүйемізді кез келген жолмен тексере аласыз. Осылайша, біз үшін нәтижелерді әлемнің идеалды суретіне келтірудің мағынасы жоқ, өйткені Бізді тексеру өте оңай. Баруға тым жалқау және уақыты жоқтар үшін қашықтан тестілеуді ұйымдастыра аламыз. Ол үшін бізде арнайы зертхана бар. Бізбен хабарласыңы.

ACHTUNG-2! Бұл сынақ жүктеме сынағы емес, өйткені мұнда біз тек ақауларға төзімділік туралы ойлаймыз. Бір-екі аптадан кейін біз қуаттырақ стенд дайындаймыз және сақтау жүйесін жүктеме сынағымен өткіземіз, нәтижелерді осында жариялаймыз (айтпақшы, сынақтарға сұраныстар қабылданады).

Ендеше, оны сындырайық.

сынақ стенді

Біздің стенд келесі жабдықтан тұрады:

  • 1 x Aerodisk Engine N2 сақтау жүйесі (2 контроллер, 64 ГБ кэш, 8xFC порты 8 Гб/с, 4xEthernet порты 10 Гб/с SFP+, 4 xEthernet порты 1 Гб/с); Сақтау жүйесінде келесі дискілер орнатылған:
  • 4 x SAS SSD дискілері 900 ГБ;
  • 12 x SAS 10k дискілері 1,2 ТБ;
  • Windows Server 1 жүйесі бар 2016 x физикалық сервер (2xXeon E5 2667 v3, 96 ГБ жедел жады, 2xFC порты 8 Гб/с, 2 xEthernet порты 10 Гб/с SFP+);
  • 2 x SAN 8G қосқышы;
  • 2 x LAN 10G қосқышы;

Біз серверді сақтау жүйесіне FC және 10G Ethernet арқылы қосқыштар арқылы қостық. Стенд диаграммасы төменде берілген.

AERODISK ENGINE N2 сақтау жүйесінің апаттық сынақтары, беріктік сынағы

MPIO және iSCSI бастамашысы сияқты бізге қажет құрамдас бөліктер Windows серверінде орнатылған.
Аймақтар FC қосқыштарында конфигурацияланған, сәйкес VLAN желілері LAN қосқыштарында конфигурацияланған, ал MTU 9000 сақтау порттарында, қосқыштарда және хостта орнатылған (бұның барлығын жасау құжаттамамызда сипатталған, сондықтан біз сипаттамаймыз. бұл процесс осында).

Сынақ әдістемесі

Апатты сынау жоспары келесідей:

  • FC және Ethernet порттарының ақаулығын тексеру.
  • Электр қуатын тексеру.
  • Контроллердің ақаулығын тексеру.
  • Топтағы/пулдағы диск ақауын тексеру.

Барлық сынақтар синтетикалық жүктеме жағдайында орындалады, біз оны IOMETER бағдарламасы арқылы жасаймыз. Параллельді түрде біз бірдей сынақтарды орындаймыз, бірақ үлкен файлдарды сақтау жүйесіне көшіру жағдайында.

IOmeter конфигурациясы келесідей:

  • Оқу/жазу – 70/30
  • Блок – 128к (сақтау жүйелерін үлкен блоктарда жууды шештік)
  • Жіптер саны – 128 (бұл өнімді жүктемеге өте ұқсас)
  • Толық кездейсоқ
  • Жұмысшылар саны – 4 (FC үшін 2, iSCSI үшін 2)

AERODISK ENGINE N2 сақтау жүйесінің апаттық сынақтары, беріктік сынағы
AERODISK ENGINE N2 сақтау жүйесінің апаттық сынақтары, беріктік сынағы

Тесттің келесі мақсаттары бар:

  1. Синтетикалық жүктеу және көшіру процесі әртүрлі сәтсіздік сценарийлерінде үзілмейтініне немесе қателер тудырмайтынына көз жеткізіңіз.
  2. Порттарды, контроллерлерді және т.б. ауыстыру процесі жеткілікті түрде автоматтандырылғанына және сәтсіздікке ұшыраған жағдайда әкімшінің әрекеттерін қажет етпейтініне көз жеткізіңіз (яғни, істен шығу кезінде, әрине, сәтсіздіктер туралы айтып отырған жоқпыз).
  3. Журналдардағы ақпарат дұрыс көрсетілгеніне көз жеткізіңіз.

Хост пен сақтау жүйесін дайындау

Біз FC және Ethernet порттарын (тиісінше FC және iSCSI) пайдалана отырып, сақтау жүйесінде блокқа кіруді конфигурацияладық. TS Solution компаниясының жігіттері мұны қалай жасау керектігін алдыңғы мақалада егжей-тегжейлі сипаттады (https://habr.com/ru/company/tssolution/blog/432876/). Және, әрине, нұсқаулықтар мен курстарды ешкім жойған жоқ.

Бізде бар дискілерді пайдаланып гибридтік топ құрдық. Кэшке 2 SSD дискісі қосылды, қосымша сақтау деңгейі (Онлайн деңгей) ретінде 2 SSD дискісі қосылды. Топтағы үш дискінің ақаулығын бірден тексеру үшін біз 12 SAS10k дискісін RAID-60P (үштік паритет) ішіне топтадық. Автоматты түрде ауыстыру үшін бір диск қалды.

AERODISK ENGINE N2 сақтау жүйесінің апаттық сынақтары, беріктік сынағы

Біз екі LUN қостық (біреуі FC арқылы, біреуі iSCSI арқылы).

AERODISK ENGINE N2 сақтау жүйесінің апаттық сынақтары, беріктік сынағы

Екі LUN иесі қозғалтқыш-0 контроллері болып табылады

AERODISK ENGINE N2 сақтау жүйесінің апаттық сынақтары, беріктік сынағы

Тестті бастайық

Біз IOMETER параметрін жоғарыдағы конфигурациямен қосамыз.

AERODISK ENGINE N2 сақтау жүйесінің апаттық сынақтары, беріктік сынағы

Біз 1.8 ГБ/с өткізу қабілеттілігін және 3 миллисекундтық кешігуді жазамыз. Қателер жоқ (жалпы қателер саны).

Сонымен қатар, біздің хосттың жергілікті «C» дискісінен біз басқа интерфейстерді пайдалана отырып, екі үлкен 100 ГБ файлды FC және iSCSI сақтау LUN құрылғыларына (Windows жүйесіндегі E және G дискілері) көшіруді бастаймыз.

Жоғарыда LUN FC жүйесіне көшіру процесі, төменде iSCSI.

AERODISK ENGINE N2 сақтау жүйесінің апаттық сынақтары, беріктік сынағы

Тест №1: енгізу/шығару порттарын өшіру

Біз сақтау жүйесіне арт жағынан жақындаймыз))) және қолдың аздап қозғалысы арқылы біз Engine-10 контроллерінен барлық FC және Ethernet 0G кабельдерін шығарамыз. Швабрасы бар тазалаушы әйел өтіп бара жатып, еденді сілекей жатқан және кабельдер жатқан жерде жууға шешім қабылдаған сияқты (яғни контроллер әлі жұмыс істейді, бірақ енгізу/шығару порттары өлі).

AERODISK ENGINE N2 сақтау жүйесінің апаттық сынақтары, беріктік сынағы

IOMETER және файлдарды көшіруді қарастырайық. Өткізу қабілеті 0,5 ГБ/с дейін төмендеді, бірақ тез бұрынғы деңгейіне оралды (шамамен 4-5 секундта). Қателер жоқ.

AERODISK ENGINE N2 сақтау жүйесінің апаттық сынақтары, беріктік сынағы

Файлдарды көшіру тоқтаған жоқ, жылдамдықтың төмендеуі байқалады, бірақ ол мүлдем маңызды емес (840 МБ/с-тан 720 МБ/с дейін төмендеді). Көшіру тоқтаған жоқ.

Біз сақтау жүйесінің журналдарын қарап, порттардың қолжетімсіздігі және топтың автоматты түрде орын ауыстыруы туралы хабарламаны көреміз.

AERODISK ENGINE N2 сақтау жүйесінің апаттық сынақтары, беріктік сынағы

Ақпараттық тақта сонымен қатар FC порттарымен бәрі жақсы емес екенін айтады.

AERODISK ENGINE N2 сақтау жүйесінің апаттық сынақтары, беріктік сынағы

Сақтау жүйесі енгізу/шығару порттарының істен шығуынан аман қалды сәтті.

Сынақ № 2. Сақтау контроллерін өшіру

Бірден дерлік (кабельдерді сақтау жүйесіне қайта қосқаннан кейін) біз контроллерді шассиден шығару арқылы сақтау жүйесін аяқтауды шештік.

Біз қайтадан сақтау жүйесіне арт жағынан жақындаймыз (бізге ұнады))) және бұл жолы біз қазіргі уақытта RDG (топ көшкен) иесі болып табылатын Engine-1 контроллерін шығарамыз.

IOmeter-дегі жағдай келесідей. I/O шамамен 5 секундқа тоқтады. Қателер жиналмайды.

AERODISK ENGINE N2 сақтау жүйесінің апаттық сынақтары, беріктік сынағы

5 секундтан кейін енгізу/шығару шамамен бірдей өткізу қабілеттілігімен, бірақ 35 миллисекундтық кідірістермен қайта жалғасты (кідіріс шамамен бірнеше минуттан кейін түзетілді). Скриншоттардан көрініп тұрғандай, қателердің жалпы саны 0-ге тең, яғни жазу немесе оқу қателері болған жоқ.

AERODISK ENGINE N2 сақтау жүйесінің апаттық сынақтары, беріктік сынағы

Файлдарымызды көшіруді қарастырайық. Көріп отырғаныңыздай, ол үзілмеді, өнімділіктің аздап төмендеуі болды, бірақ барлығы бірдей ~ 800 МБ/с-қа оралды.

AERODISK ENGINE N2 сақтау жүйесінің апаттық сынақтары, беріктік сынағы

Біз сақтау жүйесіне барамыз және ақпараттық панельде Engine-1 контроллері қол жетімді емес деген қарғысты көреміз (әрине, біз оны өлтірдік).

AERODISK ENGINE N2 сақтау жүйесінің апаттық сынақтары, беріктік сынағы

Біз журналдарда да ұқсас жазбаны көреміз.

AERODISK ENGINE N2 сақтау жүйесінің апаттық сынақтары, беріктік сынағы

Сақтау контроллері де сәтсіздіктен аман қалды сәтті.

Сынақ №3: Қуат көзін ажырату.

Қалай болғанда да, біз файлдарды қайта көшіруді бастадық, бірақ IOMETER-ді тоқтатпадық.
Біз қуат блогын тартамыз.

AERODISK ENGINE N2 сақтау жүйесінің апаттық сынақтары, беріктік сынағы

Ақпарат тақтасындағы сақтау жүйесіне тағы бір ескерту қосылды.

AERODISK ENGINE N2 сақтау жүйесінің апаттық сынақтары, беріктік сынағы

Сондай-ақ сенсорлар мәзірінде ажыратылған қуат көзіне байланысты сенсорлардың қызылға айналғанын көреміз.

AERODISK ENGINE N2 сақтау жүйесінің апаттық сынақтары, беріктік сынағы

Сақтау жүйесі жұмысын жалғастыруда. Қуат блогының істен шығуы сақтау жүйесінің жұмысына ешқандай әсер етпейді; хост көзқарасы бойынша көшіру жылдамдығы мен IOMETER көрсеткіштері өзгеріссіз қалды.

Электр қуатының бұзылуы сынағы өтті сәтті.

Соңғы сынақтан бұрын біз сақтау жүйесін сәл қалпына келтіруді, контроллер мен қуат блогын қалпына келтіруді, сондай-ақ кабельдерді ретке келтіруді шештік, бұл туралы сақтау жүйесі денсаулық тақтасындағы жасыл белгішелермен қуана хабардар етті. .

AERODISK ENGINE N2 сақтау жүйесінің апаттық сынақтары, беріктік сынағы

Тест No 4. Топтағы үш дискінің істен шығуы

Осы сынақтан бұрын біз қосымша дайындық қадамын жасадық. ENGINE сақтау жүйесі өте пайдалы нәрсені қамтамасыз етеді - әртүрлі қайта құру саясаттары. TS Solution бұл мүмкіндік туралы бұрын жазған, бірақ оның мәнін еске түсірейік. Жад әкімшісі қайта құру кезінде ресурстарды бөлудің басымдылығын көрсете алады. Енгізу/шығару өнімділігі бағытында, яғни қайта құру ұзағырақ уақыт алады, бірақ өнімділіктің төмендеуі жоқ. Немесе қайта құру жылдамдығы бағытында, бірақ өнімділік төмендейді. Немесе теңдестірілген опция. Дискілер тобын қайта құру кезінде сақтау өнімділігі әрқашан әкімшінің бас ауруы болғандықтан, біз енгізу/шығару өнімділігіне бейімділікпен және қайта құру жылдамдығы есебінен саясатты сынаймыз.

AERODISK ENGINE N2 сақтау жүйесінің апаттық сынақтары, беріктік сынағы

Енді дискінің ақаулығын тексерейік. Біз сондай-ақ LUN-ға (файлдар мен IOMETER) жазуды қосамыз. Бізде үштік паритет (RAID-60P) бар топ болғандықтан, бұл жүйе үш дискінің істен шығуына төтеп беруі керек дегенді білдіреді, ал сәтсіздіктен кейін автоматты ауыстыру жұмыс істеуі керек, бір дискі сәтсіз болғандардың біреуінің орнын алуы керек. РДГ-да және одан қайта құру басталуы керек.

БАСТА. Біріншіден, сақтау интерфейсі арқылы біз шығарғымыз келетін дискілерді бөлектеңіз (автоматты өзгерту дискісін жіберіп алмау және тартпау үшін).

AERODISK ENGINE N2 сақтау жүйесінің апаттық сынақтары, беріктік сынағы

Біз аппараттық құралдағы көрсеткішті тексереміз. Барлығы жақсы, біз үш бөлектелген дискіні көреміз.

AERODISK ENGINE N2 сақтау жүйесінің апаттық сынақтары, беріктік сынағы

Ал біз осы үш дискіні шығарамыз.

AERODISK ENGINE N2 сақтау жүйесінің апаттық сынақтары, беріктік сынағы

Хостта не бар екенін көрейік. Ал сонда... ерекше ештеңе болған жоқ.

AERODISK ENGINE N2 сақтау жүйесінің апаттық сынақтары, беріктік сынағы
AERODISK ENGINE N2 сақтау жүйесінің апаттық сынақтары, беріктік сынағы

Көшіру индикаторлары (олар басындағыдан жоғары, себебі кэш қызып кетті) және IOMETER дискілерді алып тастағанда және қайта құруды бастағанда көп өзгермейді (5-10% шегінде).

Сақтау жүйесінде не бар екенін қарастырайық.

AERODISK ENGINE N2 сақтау жүйесінің апаттық сынақтары, беріктік сынағы

Топ статусында қайта құрылымдау процесі басталып, аяқталуға жақын екенін көреміз.

AERODISK ENGINE N2 сақтау жүйесінің апаттық сынақтары, беріктік сынағы

RDG қаңқасында 2 диск қызыл күйде екенін және біреуі ауыстырылғанын көруге болады. Автоматты түрде ауыстыру дискісі енді жоқ, ол 3-ші істен шыққан дискіні ауыстырды. Қайта құру бірнеше минутқа созылды, 3 дискілер сәтсіз болған кезде файлдарды жазу үзілмеді және енгізу/шығару өнімділігі айтарлықтай өзгермеді.

AERODISK ENGINE N2 сақтау жүйесінің апаттық сынақтары, беріктік сынағы

AERODISK ENGINE N2 сақтау жүйесінің апаттық сынақтары, беріктік сынағы

Дискінің ақаулығы сынағы сөзсіз өтті сәтті.

қорытынды

Осы кезде біз сақтау жүйелеріне қатысты зорлық-зомбылықты тоқтатуды шештік. Қорытындылай келе:

  • FC портының ақаулығын тексеру - сәтті
  • Ethernet портының ақаулығын тексеру - сәтті
  • Контроллердің ақаулығын тексеру - сәтті
  • Қуат ақауының сынағы – сәтті өтті
  • Топтық пулда диск ақаулығын тексеру - сәтті

Сәтсіздіктердің ешқайсысы жазуды тоқтатпады немесе синтетикалық жүктемеде қателіктер туғызды; әрине, өнімділік хит болды (және біз оны қалай жеңуге болатынын білеміз, оны жақын арада жасаймыз), бірақ бұл секундтар екенін ескерсек, бұл өте қолайлы. Қорытынды: AERODISK сақтау жүйесінің барлық компоненттерінің ақауға төзімділігі өз деңгейінде жұмыс істеді, ақаулық нүктелері болмады.

Әлбетте, бір мақалада біз барлық сәтсіздік сценарийлерін тексере алмаймыз, бірақ біз ең танымалдарын қамтуға тырыстық. Сондықтан, өз пікірлеріңізді, алдағы басылымдарға ұсыныстарыңызды және, әрине, адекватты сындарыңызды жолдаңыздар. Біз талқылауға қуаныштымыз (немесе жақсырақ, тренингке келіңіз, мен кестені қайталаймын)! Жаңа сынақтарға дейін!

  • Нижний Новгород (БҰЗЫНАН АШЫҚ – осында тіркелуге болады https://aerodisk.promo/nn/);
    16 жылдың 2019 сәуіріне дейін орталыққа кез келген жұмыс уақытында келуге болады, ал 16 жылдың 2019 сәуірінде үлкен оқу курсы ұйымдастырылады.
  • Краснодар (ЖАҚЫНДА АШЫЛАДЫ - осында жазылуға болады https://aerodisk.promo/krsnd/ );
    9 жылдың 25 сәуірі мен 2019 сәуірі аралығында орталыққа кез келген жұмыс уақытында келуге болады, ал 25 жылдың 2019 сәуірінде үлкен оқу курсы ұйымдастырылады.
  • Екатеринбург (ЖАҚЫНДА АШЫЛАДЫ, біздің веб-сайттағы немесе Хабредегі ақпаратты қадағалаңыз);
    2019 жылғы мамыр-маусым.
  • Новосибирск (біздің веб-сайттағы немесе Habre сайтындағы ақпаратты қадағалаңыз);
    2019 жылдың қазаны.
  • Красноярск (біздің веб-сайттағы немесе Habre сайтындағы ақпаратты қадағалаңыз);
    Қараша 2019 ж

Ақпарат көзі: www.habr.com

пікір қалдыру