Ferminderje downtime risiko's mei Shared Nothing-arsjitektuer

It ûnderwerp fan fouttolerânsje yn systemen foar opslach fan gegevens is altyd relevant, om't yn ús tiid fan wiidferspraat virtualisaasje en konsolidaasje fan boarnen opslachsystemen de keppeling binne wêrfan it mislearjen net allinich sil liede ta in gewoan ûngelok, mar ta lange termyn downtime fan tsjinsten. Dêrom befetsje moderne opslachsystemen in protte dûbele komponinten (sels controllers). Mar is sa'n beskerming genôch?

Ferminderje downtime risiko's mei Shared Nothing-arsjitektuer

Absoluut alle leveransiers neame by it listjen fan de skaaimerken fan opslachsystemen altyd de hege fouttolerânsje fan har oplossingen, en foegje altyd de term "sûnder ien punt fan mislearring" ta. Litte wy in typysk opslachsysteem in tichterby besjen. Om foar te kommen downtime yn ûnderhâld, duplicates it opslach systeem macht foarrieden, cooling modules, input / output havens, driuwfearren (wy bedoele RAID) en, fansels, controllers. As jo ​​​​dizze arsjitektuer goed besjogge, sille jo op syn minst twa mooglike punten fan mislearring fernimme, dy't beskieden stil wurde hâlden:

  1. Beskikberens fan in inkele backplane
  2. It hawwen fan ien kopy fan de gegevens

De backplane is in technysk kompleks apparaat dat moat ûndergean serieuze testen tidens produksje. En dêrom binne d'r ekstreem seldsume gefallen as it folslein mislearret. Lykwols, sels yn it gefal fan in part problemen, lykas in net-funksjonearjende drive slot, it sil moatte wurde ferfongen troch in folsleine shutdown fan it opslach systeem.

It meitsjen fan meardere kopyen fan gegevens is ek op it earste each gjin probleem. Bygelyks, de Clone-funksjonaliteit yn opslachsystemen, wêrtroch jo in folsleine kopy fan gegevens op guon yntervallen kinne bywurkje, is frij wiidferspraat. Lykwols, yn gefal fan problemen mei deselde backplay, de kopy sil wêze like net beskikber as it orizjineel.

In folslein foar de hân lizzende oplossing om dizze tekoarten te oerwinnen is replikaasje nei in oar opslachsysteem. As wy de eagen slute foar de ferwachte ferdûbeling fan de kosten fan hardware (wy geane der noch fan út dat minsken dy't sa'n beslút kieze adekwaat tinke en dit feit foarôf akseptearje), dan komme der noch mooglik kosten foar it organisearjen fan replikaasje yn 'e foarm fan lisinsjes, ekstra software en hardware. En it wichtichste is dat jo op ien of oare manier de konsistinsje fan 'e replikearre gegevens moatte soargje. Dy. bouwe in opslach virtualizer / vSAN / ensfh, dy't ek fereasket jild en tiid middels.

AccelStor By it meitsjen fan ús systemen foar hege beskikberens, sette wy in doel om de boppeneamde tekoarten kwyt te reitsjen. Dit is hoe't de ynterpretaasje fan Shared Nothing technology ferskynde, dy't frij oerset betsjut "sûnder it brûken fan dielde apparaten."

Konsept Dielde neat arsjitektuer stiet foar it brûken fan twa ûnôfhinklike knopen (controllers), elk fan dat hat syn eigen set fan gegevens. Syngroane replikaasje komt foar tusken knopen fia de InfiniBand 56G-ynterface, folslein transparant foar de software dy't boppe op it opslachsysteem rint. As gefolch, it brûken fan opslach virtualizers, software aginten, ensfh is net fereaske.

Fysiek kin de twa-node-oplossing fan AccelStor wurde ymplementearre yn twa modellen:

  • H510 - basearre op Twin-tsjinners yn in 2U-saak, as matige prestaasjes en kapasiteit oant 22TB binne fereaske;
  • H710 - basearre op yndividuele 2U-tsjinners, as hege prestaasjes en grutte kapasiteit (oant 57TB) nedich binne.

Ferminderje downtime risiko's mei Shared Nothing-arsjitektuer

Model H510 basearre op Twin tsjinner

Ferminderje downtime risiko's mei Shared Nothing-arsjitektuer

Model H710 basearre op yndividuele tsjinners

It gebrûk fan ferskate foarmfaktoaren is te tankjen oan it ferlet fan ferskate oantallen SSD's om in bepaald folume en prestaasjes te berikken. Plus, it Twin-platfoarm is goedkeaper en lit jo mear betelbere oplossingen oanbiede, hoewol mei wat betingst "neideel" yn 'e foarm fan in inkele efterplane. Al it oare, ynklusyf de operaasjeprinsipes, is folslein identyk foar beide modellen.

De gegevensset foar elke node hat twa groepen FlexiRemap, plus 2 hot spares. Elke groep is yn steat om it mislearjen fan ien SSD te wjerstean. Alle ynkommende fersiken om opnimme in knooppunt yn oerienstimming mei ideology FlexiRemap bouwt 4KB-blokken op 'e nij yn opfolgjende keatlingen, dy't dan wurde skreaun nei de SSD yn 'e meast noflike modus foar har (sekwinsjele opname). Boppedat ûntfangt de host allinich in opnamebefêstiging nei't de gegevens fysyk op 'e SSD pleatst binne, d.w.s. sûnder caching yn RAM. It resultaat is heul yndrukwekkende prestaasjes fan maksimaal 600K IOPS-skriuwen en 1M+ IOPS-lêzen (model H710).

Lykas earder neamd, wurde gegevenssets yn real time syngronisearre fia de InfiniBand 56G-ynterface, dy't hege trochset en lege latency hat. Om it kommunikaasjekanaal it effisjinter te brûken by it ferstjoeren fan lytse pakketten. Omdat D'r is mar ien kommunikaasjekanaal; in tawijd 1GbE-keppeling wurdt brûkt foar ekstra hertslachkontrôle. Allinich hertslach wurdt dêrtroch oerbrocht, dus binne d'r gjin easken foar snelheidskaaimerken.

Yn gefal fan tanimmende systeem kapasiteit (oant 400 + TB) fanwege útwreiding planken se binne ek yn pearen ferbûn om it konsept "gjin ienige punt fan mislearring" te behâlden.

Foar ekstra gegevensbeskerming (njonken it feit dat AccelStor al twa kopyen hat), wurdt in spesjale gedrachsalgoritme brûkt yn gefal fan in mislearring fan in SSD. As de SSD mislearret, sil it knooppunt begjinne mei it werbouwen fan gegevens op ien fan 'e hot spare-skiven. De FlexiRemap-groep, dy't yn 'e degradearre steat is, sil oerskeakelje nei allinich lêze modus. Dit wurdt dien om ynterferinsje te eliminearjen tusken skriuw- en werbouwoperaasjes op 'e reservekopyskiif, dy't úteinlik it herstelproses fersnelt en de tiid fermindert as it systeem potinsjeel kwetsber is. Nei it foltôgjen fan 'e werbou komt it knooppunt werom nei normale lês-skriuwmodus.

Ferminderje downtime risiko's mei Shared Nothing-arsjitektuer

Fansels, lykas oare systemen, tidens it werbouwen fan 'e totale prestaasjes nimt ôf (nei alles wurket ien fan' e FlexiRemap-groepen net foar opname). Mar it herstelproses sels komt sa gau mooglik foar, wat AccelStor-systemen ûnderskiedt fan oplossingen fan oare leveransiers.

In oare nuttige eigenskip fan 'e Nothing Shared-arsjitektuertechnology is de wurking fan knopen yn' e saneamde wiere aktyf-aktive modus. Oars as de "klassike" arsjitektuer, wêrby't mar ien kontrôler in spesifyk folume/pool hat, en de twadde gewoan I/O-operaasjes útfiert, yn systemen AccelStor elk knooppunt wurket mei in eigen set fan gegevens en stjoert gjin fersiken nei syn "buorman". As resultaat wurdt de algemiene systeemprestaasjes ferbettere troch de parallelle ferwurking fan I / O-oanfragen troch knopen en tagong ta driuwfearren. D'r is ek praktysk net sa'n ding as failover, om't d'r gewoan gjin need is om kontrôle fan folumes oer te dragen nei in oare knooppunt yn gefal fan in mislearring.

As wy de Nothing Shared-arsjitektuertechnology fergelykje mei folweardige duplikaasje fan opslachsysteem, dan sil it op it earste each in bytsje minder wêze as de folsleine ymplemintaasje fan rampherstel yn fleksibiliteit. Dit is benammen wier foar it organisearjen fan in kommunikaasjeline tusken opslachsystemen. Sa, yn it model H710 is it mooglik om te fersprieden knooppunten oer in ôfstân fan maksimaal 100m troch it brûken fan net hiel goedkeap InfiniBand aktive optyske kabels. Mar sels as fergelike mei de gewoane ymplemintaasje fan syngroane replikaasje fan oare leveransiers fia in beskikber FibreChannel, sels oer langere ôfstannen, sil de oplossing fan AccelStor goedkeaper en makliker wêze om te ynstallearjen / te betsjinjen, om't it is net nedich om te ynstallearjen opslach virtualizers en / of yntegrearje mei software (dat is net altyd mooglik yn prinsipe). Plus, ferjit net dat AccelStor-oplossingen All Flash-arrays binne mei prestaasjes heger dan dy fan "klassike" opslachsystemen mei allinich SSD.

Ferminderje downtime risiko's mei Shared Nothing-arsjitektuer

By it brûken fan AccelStor's Nothing Shared-arsjitektuer is it mooglik om 99.9999% beskikberens fan opslachsysteem te berikken tsjin in heul ridlike kosten. Tegearre mei de hege betrouberens fan 'e oplossing, ynklusyf troch it brûken fan twa kopyen fan gegevens, en yndrukwekkende prestaasjes troch proprietêre algoritmen FlexiRemap, oplossings út AccelStor binne poerbêste kandidaten foar wichtige posysjes by it bouwen fan in modern datasintrum.

Boarne: www.habr.com

Add a comment