Testet e përplasjes së sistemit të ruajtjes AERODISK ENGINE N2, testi i forcës

Testet e përplasjes së sistemit të ruajtjes AERODISK ENGINE N2, testi i forcës

Pershendetje te gjitheve! Me këtë artikull, AERODISK hap një blog në Habré. Urra, shokë!

Artikujt e mëparshëm në Habré diskutuan pyetje rreth arkitekturës dhe konfigurimit bazë të sistemeve të ruajtjes. Në këtë artikull do të shqyrtojmë një pyetje që nuk është trajtuar më parë, por që shpesh bëhet - në lidhje me tolerancën e gabimeve të sistemeve të ruajtjes së motorit AERODISK. Ekipi ynë do të bëjë gjithçka për të siguruar që sistemi i magazinimit AERODISK të ndalojë së punuari, d.m.th. thyej atë.

Kështu ndodhi që artikuj për historinë e kompanisë sonë, për produktet tona, si dhe një shembull i zbatimit të suksesshëm tashmë janë varur në Habré, për të cilat Shumë faleminderit për partnerët tanë - kompanitë TS Solution dhe Softline.

Prandaj, unë nuk do të trajnoj aftësitë e menaxhimit të copy-paste këtu, por thjesht do të jap lidhje me origjinalet e këtyre artikujve:

Dua të ndaj edhe një lajm të mirë. Por unë do të filloj, natyrisht, me problemin. Ne, si një shitës i ri, përveç kostove të tjera, ballafaqohemi vazhdimisht me faktin se shumë inxhinierë dhe administratorë thjesht nuk dinë të funksionojnë siç duhet sistemin tonë të ruajtjes.
Është e qartë se menaxhimi i shumicës së sistemeve të ruajtjes duket afërsisht i njëjtë nga pikëpamja e administratorit, por secili prodhues ka karakteristikat e veta. Dhe ne nuk bëjmë përjashtim këtu.

Prandaj, për të thjeshtuar detyrën e trajnimit të specialistëve të IT-së, vendosëm që këtë vit t'ia kushtojmë arsimit falas. Për ta bërë këtë, në shumë qytete të mëdha të Rusisë ne po hapim një rrjet të Qendrave të Kompetencës AERODISK, në të cilën çdo specialist teknik i interesuar mund të marrë një kurs absolutisht falas dhe të marrë një certifikatë në administrimin e sistemeve të ruajtjes së motorit AERODISK.

Në çdo qendër të kompetencave ne do të instalojmë një stendë të plotë demo nga sistemi i ruajtjes AERODISK dhe një server fizik, në të cilin mësuesi ynë do të zhvillojë trajnime ballë për ballë. Ne do të publikojmë orarin e punës së Qendrave të Kompetencës pas paraqitjes së tyre, por tashmë kemi hapur një qendër në Nizhny Novgorod dhe qyteti i Krasnodarit është i radhës. Ju mund të regjistroheni për trajnim duke përdorur lidhjet e mëposhtme. Këtu janë informacionet e njohura aktualisht për qytetet dhe datat:

  • Nizhny Novgorod (Tashmë HAPUR – mund të regjistroheni këtu https://aerodisk.promo/nn/);
    Deri në datën 16, qendra mund të vizitohet në çdo kohë pune, ndërsa në datën 2019 do të organizohet një kurs i madh trajnimi.
  • Krasnodar (HAPET SË shpejti - mund të regjistroheni këtu https://aerodisk.promo/krsnd/ );
    Nga data 9 prill deri më 25 prill 2019, qendra mund të vizitohet në çdo kohë pune dhe më 25 prill 2019 do të organizohet një kurs i madh trajnimi.
  • Ekaterinburgut (HAPET SË shpejti, ndiqni informacionin në faqen tonë të internetit ose në Habré);
    maj-qershor 2019.
  • Novosibirsk (ndiqni informacionin në faqen tonë të internetit ose në Habré);
    tetor 2019.
  • Krasnoyarsk (ndiqni informacionin në faqen tonë të internetit ose në Habré);
    Nëntor 2019.

Dhe, sigurisht, nëse Moska nuk është larg jush, atëherë në çdo kohë mund të vizitoni zyrën tonë në Moskë dhe t'i nënshtroheni një trajnimi të ngjashëm.

Të gjitha. Kemi mbaruar me marketingun, le të kalojmë tek teknologjia!

Në Habré ne do të publikojmë rregullisht artikuj teknikë rreth produkteve tona, testeve të ngarkesës, krahasimeve, veçorive të përdorimit dhe zbatimeve interesante.

Testet e përplasjes së sistemit të ruajtjes AERODISK ENGINE N2, testi i forcës

KUJDES! Pasi të keni lexuar artikullin, mund të thoni: mirë, natyrisht, shitësi do të kontrollojë veten në mënyrë që gjithçka të funksionojë "me një zhurmë", kushtet e serrës, etj. Unë do të përgjigjem: asgjë si kjo! Ndryshe nga konkurrentët tanë të huaj, ne jemi të vendosur këtu, afër jush, dhe ju gjithmonë mund të vini tek ne (në Moskë ose ndonjë Komitet Qendror) dhe të provoni sistemin tonë të ruajtjes në çfarëdo mënyre. Kështu, nuk ka shumë kuptim që ne t'i përshtatim rezultatet në një pamje ideale të botës, sepse Ne jemi shumë të lehtë për t'u kontrolluar. Për ata që janë shumë dembelë për të shkuar dhe nuk kanë kohë, ne mund të organizojmë testim në distancë. Ne kemi një laborator të veçantë për këtë. Na kontaktoni.

ACHTUNG-2! Ky test nuk është një test ngarkese, sepse këtu na intereson vetëm toleranca ndaj gabimeve. Brenda disa javësh, ne do të përgatisim një stendë më të fuqishme dhe do të kryejmë testimin e ngarkesës së sistemit të ruajtjes, duke publikuar rezultatet këtu (nga rruga, kërkesat për teste pranohen).

Pra, le të shkojmë ta thyejmë atë.

Stand testimi

Stenda jonë përbëhet nga hardueri i mëposhtëm:

  • 1 x sistem ruajtjeje Aerodisk Engine N2 (2 kontrollues, 64 GB cache, 8 porte xFC 8 Gb/s, 4 porta Ethernet 10 Gb/s SFP+, 4 porta Ethernet 1 Gb/s); Disqet e mëposhtëm janë instaluar në sistemin e ruajtjes:
  • 4 x disqe SAS SSD 900 GB;
  • 12 x SAS 10k disqe 1,2 TB;
  • 1 x server fizik me Windows Server 2016 (2xXeon E5 2667 v3, 96 GB RAM, 2 porte xFC 8 Gb/s, 2 porte Ethernet 10 Gb/s SFP+);
  • 2 x ndërprerës SAN 8G;
  • 2 x ndërprerës LAN 10G;

Ne e lidhëm serverin me sistemin e ruajtjes përmes ndërprerësve, si përmes FC ashtu edhe 10G Ethernet. Diagrami i stendës është më poshtë.

Testet e përplasjes së sistemit të ruajtjes AERODISK ENGINE N2, testi i forcës

Komponentët që na duhen, si MPIO dhe iniciatori iSCSI, janë instaluar në Windows Server.
Zonat janë konfiguruar në çelsat FC, VLAN-et përkatëse janë konfiguruar në çelsat LAN dhe MTU 9000 është instaluar në portat e ruajtjes, çelsin dhe hostin (si ta bëjmë të gjithë këtë përshkruhet në dokumentacionin tonë, kështu që ne nuk do të përshkruajmë ky proces këtu).

Metodologjia e Testimit

Plani i testit të përplasjes është si më poshtë:

  • Kontrollimi i dështimit të porteve FC dhe Ethernet.
  • Kontrolli i ndërprerjes së energjisë.
  • Kontrolli i dështimit të kontrollorit.
  • Kontrollimi i dështimit të diskut në një grup/pool.

Të gjitha testet do të kryhen në kushte të ngarkesës sintetike, të cilat do t'i gjenerojmë nga programi IOMETER. Paralelisht, ne do të kryejmë të njëjtat teste, por në kushtet e kopjimit të skedarëve të mëdhenj në sistemin e ruajtjes.

Konfigurimi i IOmeter është si më poshtë:

  • Lexo/Shkruaj – 70/30
  • Blloku – 128k (ne vendosëm të lajmë sistemet e ruajtjes në blloqe të mëdha)
  • Numri i fijeve – 128 (që është shumë e ngjashme me ngarkesën prodhuese)
  • Plot rastësi
  • Numri i punëtorëve – 4 (2 për FC, 2 për iSCSI)

Testet e përplasjes së sistemit të ruajtjes AERODISK ENGINE N2, testi i forcës
Testet e përplasjes së sistemit të ruajtjes AERODISK ENGINE N2, testi i forcës

Testi ka këto objektiva:

  1. Sigurohuni që procesi i ngarkimit dhe kopjimit sintetik të mos ndërpresë ose të shkaktojë gabime në skenarë të ndryshëm dështimi.
  2. Sigurohuni që procesi i ndërrimit të porteve, kontrolluesve, etj., është mjaft i automatizuar dhe nuk kërkon veprime të administratorit në rast dështimesh (domethënë, gjatë dështimeve, nuk po flasim për dështime, natyrisht).
  3. Sigurohuni që informacioni në regjistra të shfaqet saktë.

Përgatitja e hostit dhe sistemit të ruajtjes

Ne konfiguruam aksesin e bllokut në sistemin e ruajtjes duke përdorur portet FC dhe Ethernet (përkatësisht FC dhe iSCSI). Djemtë nga TS Solution përshkruan në detaje se si ta bëni këtë në një artikull të mëparshëm (https://habr.com/ru/company/tssolution/blog/432876/). Dhe, natyrisht, askush nuk i anuloi manualet dhe kurset.

Ne krijuam një grup hibrid duke përdorur të gjitha disqet që kishim. 2 disqe SSD u shtuan në cache, 2 disqe SSD u shtuan si një nivel shtesë ruajtëse (Online-nier). Ne grupuam 12 disqe SAS10k në RAID-60P (barazi e trefishtë) në mënyrë që të kontrollojmë dështimin e tre disqeve në grup menjëherë. Një disk u la për zëvendësim automatik.

Testet e përplasjes së sistemit të ruajtjes AERODISK ENGINE N2, testi i forcës

Ne lidhëm dy LUN (një përmes FC, një përmes iSCSI).

Testet e përplasjes së sistemit të ruajtjes AERODISK ENGINE N2, testi i forcës

Pronari i të dy LUN-ve është kontrolluesi Engine-0

Testet e përplasjes së sistemit të ruajtjes AERODISK ENGINE N2, testi i forcës

Le të fillojmë testin

Aktivizojmë IOMETER me konfigurimin e mësipërm.

Testet e përplasjes së sistemit të ruajtjes AERODISK ENGINE N2, testi i forcës

Ne regjistrojmë një xhiro prej 1.8 GB/s dhe një vonesë prej 3 milisekonda. Nuk ka gabime (Numri total i gabimeve).

Në të njëjtën kohë, nga disku lokal "C" i hostit tonë, ne paralelisht fillojmë të kopjojmë dy skedarë të mëdhenj 100 GB në LUN të ruajtjes FC dhe iSCSI (disqet E dhe G në Windows), duke përdorur ndërfaqe të tjera.

Më sipër është procesi i kopjimit në LUN FC, më poshtë në iSCSI.

Testet e përplasjes së sistemit të ruajtjes AERODISK ENGINE N2, testi i forcës

Testi # 1: Çaktivizimi i porteve I/O

Ne i afrohemi sistemit të ruajtjes nga pas))) dhe me një lëvizje të lehtë të dorës nxjerrim të gjitha kabllot FC dhe Ethernet 10G nga kontrolluesi Engine-0. Është sikur kaloi një pastruese me një leckë dhe vendosi të lajë dyshemenë pikërisht aty ku ndodhej gropa dhe kabllot (d.m.th. kontrolluesi punon ende, por portat I/O janë të vdekura).

Testet e përplasjes së sistemit të ruajtjes AERODISK ENGINE N2, testi i forcës

Le të shohim IOMETER-in dhe kopjimin e skedarëve. Fuqia e qarkullimit ra në 0,5 GB/s, por shpejt u kthye në nivelin e mëparshëm (në rreth 4-5 sekonda). Nuk ka gabime.

Testet e përplasjes së sistemit të ruajtjes AERODISK ENGINE N2, testi i forcës

Kopjimi i skedarëve nuk është ndalur, ka një rënie të shpejtësisë, por nuk është aspak kritike (nga 840 MB/s ka rënë në 720 MB/s). Kopjimi nuk ka të ndalur.

Ne shikojmë regjistrat e sistemit të ruajtjes dhe shohim një mesazh në lidhje me mosdisponueshmërinë e porteve dhe zhvendosjen automatike të grupit.

Testet e përplasjes së sistemit të ruajtjes AERODISK ENGINE N2, testi i forcës

Paneli i informacionit gjithashtu na tregon se gjithçka nuk është shumë mirë me portet FC.

Testet e përplasjes së sistemit të ruajtjes AERODISK ENGINE N2, testi i forcës

Sistemi i ruajtjes i mbijetoi një dështimi të porteve I/O me sukses.

Testi nr. 2. Çaktivizimi i kontrolluesit të ruajtjes

Pothuajse menjëherë (pasi i lidhëm kabllot përsëri në sistemin e ruajtjes) vendosëm të përfundonim sistemin e ruajtjes duke e tërhequr kontrolluesin nga shasia.

Përsëri i afrohemi sistemit të ruajtjes nga pas (na pëlqeu))) dhe këtë herë nxjerrim kontrolluesin Engine-1, i cili në këtë moment është pronari i RDG (në të cilin u zhvendos grupi).

Situata në IOmeter është si më poshtë. I/O ndaloi për rreth 5 sekonda. Gabimet nuk grumbullohen.

Testet e përplasjes së sistemit të ruajtjes AERODISK ENGINE N2, testi i forcës

Pas 5 sekondash, I/O rifilloi me pothuajse të njëjtin xhiro, por me vonesa prej 35 milisekonda (vonesat u korrigjuan pas rreth disa minutash). Siç mund të shihet nga pamjet e ekranit, vlera totale e numërimit të gabimeve është 0, domethënë, nuk ka pasur gabime në shkrim ose në lexim.

Testet e përplasjes së sistemit të ruajtjes AERODISK ENGINE N2, testi i forcës

Le të shohim kopjimin e skedarëve tanë. Siç mund ta shihni, nuk u ndërpre, pati një rënie të lehtë të performancës, por në përgjithësi gjithçka u kthye në të njëjtat ~ 800 MB/s.

Testet e përplasjes së sistemit të ruajtjes AERODISK ENGINE N2, testi i forcës

Ne shkojmë në sistemin e ruajtjes dhe shohim një mallkim në panelin e informacionit që kontrolluesi Engine-1 nuk është i disponueshëm (natyrisht, ne e vramë atë).

Testet e përplasjes së sistemit të ruajtjes AERODISK ENGINE N2, testi i forcës

Ne shohim gjithashtu një hyrje të ngjashme në regjistrat.

Testet e përplasjes së sistemit të ruajtjes AERODISK ENGINE N2, testi i forcës

Kontrolluesi i ruajtjes gjithashtu i mbijetoi një dështimi me sukses.

Testi nr. 3: Shkëputja e furnizimit me energji elektrike.

Për çdo rast, ne filluam kopjimin e skedarëve përsëri, por nuk e ndalëm IOMETER.
Ne tërheqim njësinë e furnizimit me energji elektrike.

Testet e përplasjes së sistemit të ruajtjes AERODISK ENGINE N2, testi i forcës

Një tjetër alarm është shtuar në sistemin e ruajtjes në panelin e informacionit.

Testet e përplasjes së sistemit të ruajtjes AERODISK ENGINE N2, testi i forcës

Gjithashtu në menynë e sensorëve shohim që sensorët e lidhur me furnizimin me energji elektrike të nxjerrë janë kthyer në të kuqe.

Testet e përplasjes së sistemit të ruajtjes AERODISK ENGINE N2, testi i forcës

Sistemi i ruajtjes vazhdon të funksionojë. Dështimi i njësisë së furnizimit me energji nuk ndikon në asnjë mënyrë funksionimin e sistemit të ruajtjes; nga këndvështrimi i hostit, treguesit e shpejtësisë së kopjimit dhe IOMETER mbetën të pandryshuar.

Testi i ndërprerjes së energjisë ka kaluar me sukses.

Para testit përfundimtar, vendosëm të kthejmë pak në jetë sistemin e magazinimit, të rivendosim kontrolluesin dhe njësinë e furnizimit me energji elektrike, si dhe të rregullojmë kabllot, për të cilat sistemi i ruajtjes na informoi me kënaqësi me ikona jeshile në panelin e tij shëndetësor. .

Testet e përplasjes së sistemit të ruajtjes AERODISK ENGINE N2, testi i forcës

Testi nr. 4. Dështimi i tre disqeve në një grup

Para këtij testi, ne kryem një hap shtesë përgatitor. Fakti është se sistemi i ruajtjes ENGINE ofron një gjë shumë të dobishme - politika të ndryshme rindërtimi. TS Solution shkroi për këtë veçori më herët, por le të kujtojmë thelbin e tij. Administratori i ruajtjes mund të specifikojë prioritetin për shpërndarjen e burimeve gjatë rindërtimit. Ose në drejtimin e performancës I/O, domethënë, rindërtimi zgjat më shumë, por nuk ka tërheqje të performancës. Ose në drejtim të shpejtësisë së rindërtimit, por produktiviteti do të ulet. Ose një opsion i balancuar. Meqenëse performanca e ruajtjes gjatë rindërtimit të grupit të diskut është gjithmonë një dhimbje koke e një administratori, ne do të testojmë një politikë me një anim ndaj performancës I/O dhe në kurriz të shpejtësisë së rindërtimit.

Testet e përplasjes së sistemit të ruajtjes AERODISK ENGINE N2, testi i forcës

Tani le të kontrollojmë për dështimin e diskut. Ne gjithashtu mundësojmë regjistrimin në LUN (skedarë dhe IOMETER). Meqenëse kemi një grup me barazi të trefishtë (RAID-60P), kjo do të thotë që sistemi duhet të përballojë dështimin e tre disqeve, dhe pas dështimit, zëvendësimi automatik duhet të funksionojë, një disk duhet të zërë vendin e njërit prej atyre që dështojnë. në RDG, dhe rindërtimi duhet të fillojë në të.

Filloni. Së pari, përmes ndërfaqes së ruajtjes, le të theksojmë disqet që duam të nxjerrim (në mënyrë që të mos humbasim dhe tërhiqni diskun e ndërrimit automatik).

Testet e përplasjes së sistemit të ruajtjes AERODISK ENGINE N2, testi i forcës

Ne kontrollojmë treguesin në pajisje. Gjithçka është në rregull, ne shohim tre disqe të theksuara.

Testet e përplasjes së sistemit të ruajtjes AERODISK ENGINE N2, testi i forcës

Dhe ne nxjerrim këto tre disqe.

Testet e përplasjes së sistemit të ruajtjes AERODISK ENGINE N2, testi i forcës

Le të shohim se çfarë është në host. Dhe atje... asgjë e veçantë nuk ndodhi.

Testet e përplasjes së sistemit të ruajtjes AERODISK ENGINE N2, testi i forcës
Testet e përplasjes së sistemit të ruajtjes AERODISK ENGINE N2, testi i forcës

Treguesit e kopjimit (janë më të lartë se në fillim, sepse cache është ngrohur) dhe IOMETER nuk ndryshojnë shumë gjatë heqjes së disqeve dhe fillimit të rindërtimit (brenda 5-10%).

Le të shohim se çfarë ka në sistemin e ruajtjes.

Testet e përplasjes së sistemit të ruajtjes AERODISK ENGINE N2, testi i forcës

Në statusin e grupit shohim se procesi i ristrukturimit ka nisur dhe është afër përfundimit.

Testet e përplasjes së sistemit të ruajtjes AERODISK ENGINE N2, testi i forcës

Në skeletin RDG mund të shihni se 2 disqe janë në statusin e kuq, dhe një është zëvendësuar tashmë. Disku i zëvendësimit automatik nuk është më aty; ai zëvendësoi diskun e tretë të dështuar. Rindërtimi zgjati disa minuta, shkrimi i skedarëve kur 3 disqe dështonin nuk u ndërpre dhe performanca e hyrjes/daljes nuk ndryshoi shumë.

Testet e përplasjes së sistemit të ruajtjes AERODISK ENGINE N2, testi i forcës

Testet e përplasjes së sistemit të ruajtjes AERODISK ENGINE N2, testi i forcës

Testi i dështimit të diskut kaloi patjetër me sukses.

Përfundim

Në këtë pikë, ne vendosëm të ndalojmë dhunën ndaj sistemeve të ruajtjes. Le të përmbledhim:

  • Kontrolli i dështimit të portit FC - i suksesshëm
  • Kontrolli i dështimit të portit Ethernet - i suksesshëm
  • Kontrolli i dështimit të kontrolluesit - i suksesshëm
  • Testi i dështimit të rrymës - i suksesshëm
  • Kontrollimi i dështimit të diskut në grouppool - i suksesshëm

Asnjë nga dështimet nuk ndaloi regjistrimin ose shkaktoi gabime në ngarkesën sintetike; natyrisht, pati një goditje të performancës (dhe ne e dimë se si ta kapërcejmë, gjë që do ta bëjmë së shpejti), por duke qenë se këto janë sekonda, është mjaft e pranueshme. Përfundim: toleranca e gabimeve të të gjithë komponentëve të sistemit të ruajtjes AERODISK funksionoi në nivel, nuk kishte pika dështimi.

Natyrisht, në një artikull nuk mund të testojmë të gjithë skenarët e dështimit, por u përpoqëm të mbulojmë ato më të njohurat. Prandaj, ju lutemi dërgoni komentet tuaja, sugjerimet për publikimet e ardhshme dhe, natyrisht, kritikat adekuate. Do të jemi të lumtur të diskutojmë (ose më mirë akoma, ejani në trajnim, unë kopjoj orarin për çdo rast)! Deri në teste të reja!

  • Nizhny Novgorod (Tashmë HAPUR – mund të regjistroheni këtu https://aerodisk.promo/nn/);
    Deri në datën 16, qendra mund të vizitohet në çdo kohë pune, ndërsa në datën 2019 do të organizohet një kurs i madh trajnimi.
  • Krasnodar (HAPET SË shpejti - mund të regjistroheni këtu https://aerodisk.promo/krsnd/ );
    Nga data 9 prill deri më 25 prill 2019, qendra mund të vizitohet në çdo kohë pune dhe më 25 prill 2019 do të organizohet një kurs i madh trajnimi.
  • Ekaterinburgut (HAPET SË shpejti, ndiqni informacionin në faqen tonë të internetit ose në Habré);
    maj-qershor 2019.
  • Novosibirsk (ndiqni informacionin në faqen tonë të internetit ose në Habré);
    tetor 2019.
  • Krasnoyarsk (ndiqni informacionin në faqen tonë të internetit ose në Habré);
    Nëntor 2019.

Burimi: www.habr.com

Shto një koment