Vähendage seisaku riske Shared Nothing arhitektuuriga

Andmesalvestussüsteemide tõrketaluvuse teema on alati aktuaalne, kuna meie laialt levinud virtualiseerimise ja ressursside koondamise ajastul on salvestussüsteemid see lüli, mille rike ei too kaasa mitte ainult tavalist õnnetust, vaid ka teenuste pikaajalist seisakut. Seetõttu sisaldavad kaasaegsed salvestussüsteemid palju dubleeritud komponente (isegi kontrollereid). Kuid kas selline kaitse on piisav?

Vähendage seisaku riske Shared Nothing arhitektuuriga

Absoluutselt kõik müüjad mainivad salvestussüsteemide omadusi loetledes alati oma lahenduste kõrget tõrketaluvust, lisades alati termini "ilma ühegi tõrkepunktita". Vaatame lähemalt tüüpilist salvestussüsteemi. Hooldusseisakute vältimiseks dubleerib salvestussüsteem toiteallikaid, jahutusmooduleid, sisend-/väljundporte, draive (peame silmas RAID-i) ja loomulikult kontrollereid. Kui vaatate seda arhitektuuri tähelepanelikult, märkate vähemalt kahte potentsiaalset tõrkepunkti, millest tagasihoidlikult vaikitakse:

  1. Ühe tagaplaadi saadavus
  2. Andmete ühe koopia omamine

Tagaplaat on tehniliselt keeruline seade, mis peab tootmise käigus läbima tõsiseid katseid. Ja seetõttu on äärmiselt harvad juhud, kui see täielikult ebaõnnestub. Kuid isegi osaliste probleemide (nt mittetöötava draivipesa) korral tuleb see asendada salvestussüsteemi täieliku väljalülitamisega.

Ka andmetest mitme koopia loomine pole esmapilgul probleem. Näiteks on salvestussüsteemides Clone'i funktsionaalsus, mis võimaldab teatud ajavahemike järel värskendada täielikku andmete koopiat, üsna laialt levinud. Kui aga sama tagasiesitamisega on probleeme, ei ole koopia samamoodi saadaval kui originaal.

Täiesti ilmne lahendus nende puuduste ületamiseks on replikatsioon teise salvestussüsteemi. Kui paneme silmad kinni riistvara maksumuse eeldatava kahekordistumise ees (oletame siiski, et sellise otsuse valivad inimesed mõtlevad adekvaatselt ja aktsepteerivad seda fakti juba ette), on võimalikud kulud replikatsiooni korraldamiseks litsentside näol, täiendavad tarkvara ja riistvara. Ja mis kõige tähtsam, peate kuidagi tagama kopeeritud andmete järjepidevuse. Need. ehitada ladustamise virtualiseerija/vSAN/jne, mis nõuab samuti raha ja ajaressurssi.

AccelStor Oma High Availability süsteemide loomisel seame eesmärgiks vabaneda eelnimetatud puudustest. Nii ilmus Shared Nothing tehnoloogia tõlgendus, mis vabatõlkes tähendab "ilma jagatud seadmeid kasutamata".

Mõiste Jagatud ei midagi arhitektuur esindab kahe sõltumatu sõlme (kontrolleri) kasutamist, millest igaühel on oma andmekogum. Sünkroonne replikatsioon toimub sõlmede vahel InfiniBand 56G liidese kaudu, mis on salvestussüsteemi peal töötava tarkvara jaoks täiesti läbipaistev. Sellest tulenevalt ei ole salvestusruumi virtualiseerijate, tarkvara agentide jms kasutamine vajalik.

Füüsiliselt saab AccelStori kahe sõlmega lahendust rakendada kahes mudelis:

  • H510 — põhineb kaksikserveritel 2U korpuses, kui nõutakse mõõdukat jõudlust ja kuni 22TB mahtu;
  • H710 — põhineb üksikutel 2U serveritel, kui on vaja suurt jõudlust ja suurt mahtu (kuni 57TB).

Vähendage seisaku riske Shared Nothing arhitektuuriga

Mudel H510 põhineb Twin serveril

Vähendage seisaku riske Shared Nothing arhitektuuriga

Mudel H710, mis põhineb üksikutel serveritel

Erinevate vormitegurite kasutamine on tingitud vajadusest erineva arvu SSD-de järele, et saavutada etteantud maht ja jõudlus. Lisaks on Twin platvorm odavam ja võimaldab pakkuda soodsamaid lahendusi, ehkki mõne tingliku "puudusega" ühe tagaplaadi näol. Kõik muu, sealhulgas tööpõhimõtted, on mõlema mudeli puhul täiesti identsed.

Iga sõlme andmekogumil on kaks rühma FlexiRemap, pluss 2 kuuma varuosa. Iga rühm suudab vastu pidada ühe SSD rikkele. Kõik sissetulevad taotlused salvestada sõlm vastavalt ideoloogia FlexiRemap ehitab 4KB plokid ümber järjestikusteks ahelateks, mis seejärel kirjutatakse SSD-le nende jaoks kõige mugavamas režiimis (järjestikune salvestamine). Veelgi enam, host saab salvestamise kinnituse alles pärast seda, kui andmed on füüsiliselt SSD-le paigutatud, s.t. ilma RAM-i vahemällu salvestamata. Tulemuseks on väga muljetavaldav jõudlus kuni 600 1 IOPS-i kirjutamise ja 710M+ IOPS-i lugemisega (mudel HXNUMX).

Nagu varem mainitud, sünkroonitakse andmekogumeid reaalajas InfiniBand 56G liidese kaudu, millel on kõrge läbilaskevõime ja madal latentsusaeg. Sidekanali võimalikult efektiivseks kasutamiseks väikepakettide edastamisel. Sest Sidekanal on ainult üks; täiendavaks pulsisageduse kontrollimiseks kasutatakse spetsiaalset 1GbE linki. Selle kaudu edastatakse ainult südamelööke, mistõttu kiirusomadustele nõudeid ei esitata.

Süsteemi võimsuse suurenemise korral (kuni 400+TB) tingitud laiendusriiulid need on ka paarikaupa ühendatud, et säilitada kontseptsiooni "ei ole ühtegi tõrkepunkti".

Täiendavaks andmekaitseks (lisaks sellele, et AccelStoril on juba kaks koopiat) kasutatakse mis tahes SSD rikke korral spetsiaalset käitumisalgoritmi. Kui SSD ebaõnnestub, alustab sõlm andmete taastamist ühele kuumale varukettale. Rühm FlexiRemap, mis on halvenenud olekus, lülitub kirjutuskaitstud režiimi. Seda tehakse selleks, et kõrvaldada häired varukoopiaketta kirjutamis- ja taastamistoimingute vahel, mis lõppkokkuvõttes kiirendab taasteprotsessi ja vähendab aega, mil süsteem on potentsiaalselt haavatav. Pärast ümberehitamise lõpetamist naaseb sõlm normaalsesse lugemis-kirjutamisrežiimi.

Vähendage seisaku riske Shared Nothing arhitektuuriga

Muidugi, nagu ka teiste süsteemide puhul, väheneb ümberehitamise ajal üldine jõudlus (lõppude lõpuks ei tööta üks FlexiRemap gruppidest salvestamiseks). Kuid taastamisprotsess ise toimub võimalikult kiiresti, mis eristab AccelStori süsteeme teiste tarnijate lahendustest.

Nothing Shared arhitektuuritehnoloogia teine ​​kasulik omadus on sõlmede töötamine nn tõelises aktiivses-aktiivses režiimis. Erinevalt "klassikalisest" arhitektuurist, kus ainult üks kontroller omab konkreetset helitugevust/basseini ja teine ​​teeb süsteemides lihtsalt sisend- ja väljundtoiminguid. AccelStor iga sõlm töötab oma andmekogumiga ega edasta päringuid oma "naabrile". Selle tulemusel paraneb süsteemi üldine jõudlus tänu sõlmede sisend- ja väljundtaotluste paralleelsele töötlemisele ja draividele juurdepääsule. Samuti pole praktiliselt olemas sellist asja nagu tõrkevahetus, kuna rikke korral pole lihtsalt vajadust helitugevuste juhtimist teisele sõlmele üle anda.

Kui võrrelda Nothing Shared arhitektuuritehnoloogiat täieõigusliku salvestussüsteemi dubleerimisega, siis esmapilgul jääb see paindlikkuse osas avariitaaste täielikule rakendamisele pisut alla. See kehtib eriti salvestussüsteemide vahelise sideliini korraldamise kohta. Seega on mudelis H710 võimalik mitte väga odavate InfiniBand aktiivoptiliste kaablite abil sõlmed hajutada kuni 100m kaugusele. Kuid isegi kui võrrelda tavalise FibreChanneli kaudu teiste tarnijate sünkroonse replikatsiooni rakendamisega, on AccelStori lahendus isegi pikemate vahemaade korral odavam ja lihtsam paigaldada/kasutada, sest pole vaja paigaldada salvestusruumi virtualiseerijaid ja/või integreerida tarkvaraga (mis pole alati põhimõtteliselt võimalik). Lisaks ärge unustage, et AccelStori lahendused on kõik Flash-massiivid, mille jõudlus on suurem kui "klassikalistel" ainult SSD-ga salvestussüsteemidel.

Vähendage seisaku riske Shared Nothing arhitektuuriga

AccelStori Nothing Shared arhitektuuri kasutamisel on võimalik saavutada 99.9999% salvestussüsteemi saadavus väga mõistliku kuluga. Lisaks lahenduse kõrgele töökindlusele, sealhulgas kahe andmekoopia kasutamisele, ja muljetavaldavale jõudlusele tänu patenteeritud algoritmidele FlexiRemap, lahendusi alates AccelStor on suurepärased kandidaadid võtmepositsioonidele kaasaegse andmekeskuse ehitamisel.

Allikas: www.habr.com

Lisa kommentaar