Samaziniet dīkstāves riskus, izmantojot Shared Nothing arhitektūru

Tēma par kļūdu toleranci datu glabāŔanas sistēmās vienmēr ir aktuāla, jo mÅ«su plaŔās virtualizācijas un resursu konsolidācijas laikmetā uzglabāŔanas sistēmas ir saikne, kuras atteice novedÄ«s ne tikai pie parastā negadÄ«juma, bet arÄ« pie ilgstoÅ”as ā€‹ā€‹pakalpojumu dÄ«kstāves. Tāpēc mÅ«sdienu uzglabāŔanas sistēmās ir daudz dublētu komponentu (pat kontrolieri). Bet vai Ŕāda aizsardzÄ«ba ir pietiekama?

Samaziniet dīkstāves riskus, izmantojot Shared Nothing arhitektūru

PilnÄ«gi visi pārdevēji, uzskaitot uzglabāŔanas sistēmu raksturlielumus, vienmēr piemin savu risinājumu augsto kļūdu toleranci, vienmēr pievienojot terminu ā€œbez viena atteices punktaā€. SÄ«kāk apskatÄ«sim tipisku uzglabāŔanas sistēmu. Lai izvairÄ«tos no dÄ«kstāves apkopes laikā, uzglabāŔanas sistēma dublē baroÅ”anas avotus, dzesÄ“Å”anas moduļus, ievades/izvades portus, diskus (mēs domājam RAID) un, protams, kontrolierus. UzmanÄ«gi aplÅ«kojot Å”o arhitektÅ«ru, jÅ«s pamanÄ«sit vismaz divus iespējamos kļūmes punktus, par kuriem pieticÄ«gi tiek klusēts:

  1. Viena aizmugures plates pieejamība
  2. Ir viena datu kopija

Aizmugurējā plakne ir tehniski sarežģīta ierÄ«ce, kurai ražoÅ”anas laikā jāveic nopietna pārbaude. Un tāpēc ir ārkārtÄ«gi reti gadÄ«jumi, kad tas pilnÄ«bā neizdodas. Tomēr pat daļēju problēmu gadÄ«jumā, piemēram, nedarbojas diska slots, tas bÅ«s jāaizstāj ar pilnÄ«gu atmiņas sistēmas izslēgÅ”anu.

Vairāku datu kopiju izveide arÄ« nav problēma no pirmā acu uzmetiena. Piemēram, Clone funkcionalitāte uzglabāŔanas sistēmās, kas ļauj atjaunināt pilnu datu kopiju ar dažiem intervāliem, ir diezgan izplatÄ«ta. Tomēr, ja rodas problēmas ar to paÅ”u atskaņoÅ”anu, kopija bÅ«s tikpat nepieejama kā oriÄ£ināls.

PilnÄ«gi acÄ«mredzams risinājums Å”o trÅ«kumu novērÅ”anai ir replikācija citā uzglabāŔanas sistēmā. Pieverot acis uz paredzamo aparatÅ«ras izmaksu dubultoÅ”anu (joprojām pieņemam, ka cilvēki, izvēloties Ŕādu lēmumu, adekvāti domā un pieņem Å”o faktu iepriekÅ”), joprojām bÅ«s iespējamas izmaksas par replikācijas organizÄ“Å”anu licenču veidā, papildus programmatÅ«ra un aparatÅ«ra. Un pats galvenais, jums bÅ«s kaut kādā veidā jānodroÅ”ina replicēto datu konsekvence. Tie. izveidot krātuves virtualizer/vSAN/utt., kas arÄ« prasa naudas un laika resursus.

AccelStor Veidojot savas High Availability sistēmas, mēs izvirzÄ«jām mērÄ·i atbrÄ«voties no iepriekÅ”minētajiem trÅ«kumiem. Šādi parādÄ«jās tehnoloÄ£ijas Shared Nothing interpretācija, kas brÄ«vā tulkojumā nozÄ«mē ā€œneizmantojot koplietotas ierÄ«cesā€.

Jēdziens KopÄ«gots nekas arhitektÅ«ra atspoguļo divu neatkarÄ«gu mezglu (kontrolleru) izmantoÅ”anu, no kuriem katram ir savs datu kopums. Sinhronā replikācija notiek starp mezgliem, izmantojot InfiniBand 56G interfeisu, kas ir pilnÄ«bā caurspÄ«dÄ«gs programmatÅ«rai, kas darbojas uzglabāŔanas sistēmas augÅ”pusē. Tā rezultātā nav nepiecieÅ”ams izmantot krātuves virtualizatorus, programmatÅ«ras aÄ£entus utt.

Fiziski AccelStor divu mezglu risinājumu var ieviest divos modeļos:

  • H510 ā€” pamatojoties uz Twin serveriem 2U korpusā, ja nepiecieÅ”ama mērena veiktspēja un ietilpÄ«ba lÄ«dz 22TB;
  • H710 ā€” pamatojoties uz atseviŔķiem 2U serveriem, ja nepiecieÅ”ama augsta veiktspēja un liela ietilpÄ«ba (lÄ«dz 57TB).

Samaziniet dīkstāves riskus, izmantojot Shared Nothing arhitektūru

Modelis H510, kura pamatā ir Twin serveris

Samaziniet dīkstāves riskus, izmantojot Shared Nothing arhitektūru

Modelis H710, pamatojoties uz atseviŔķiem serveriem

Dažādu formas faktoru izmantoÅ”ana ir saistÄ«ta ar nepiecieÅ”amÄ«bu pēc dažāda skaita SSD, lai sasniegtu noteiktu apjomu un veiktspēju. Turklāt Twin platforma ir lētāka un ļauj piedāvāt pieejamākus risinājumus, lai gan ar dažiem nosacÄ«tiem "trÅ«kumiem" vienas aizmugures plaknes veidā. Viss pārējais, ieskaitot darbÄ«bas principus, abiem modeļiem ir pilnÄ«gi identisks.

Katra mezgla datu kopai ir divas grupas FlexiRemap, plus 2 karstas rezerves daļas. Katra grupa spēj izturēt viena SSD kļūmi. Visi ienākoÅ”ie pieprasÄ«jumi reÄ£istrēt mezglu saskaņā ar ideoloÄ£ija FlexiRemap pārbÅ«vē 4KB blokus secÄ«gās ķēdēs, kuras pēc tam tiek ierakstÄ«tas SSD tiem ērtākajā režīmā (secÄ«gā ierakstÄ«Å”ana). Turklāt resursdators saņem ieraksta apstiprinājumu tikai pēc tam, kad dati ir fiziski ievietoti SSD, t.i. bez keÅ”atmiņas saglabāŔanas RAM. Rezultāts ir ļoti iespaidÄ«ga veiktspēja lÄ«dz pat 600 K IOPS rakstÄ«Å”anai un 1 miljonam+ IOPS lasÄ«Å”anai (modelis H710).

Kā minēts iepriekÅ”, datu kopas tiek sinhronizētas reāllaikā, izmantojot InfiniBand 56G interfeisu, kam ir liela caurlaidspēja un zems latentums. Lai, pārsÅ«tot mazās paketes, pēc iespējas efektÄ«vāk izmantotu sakaru kanālu. Jo Ir tikai viens sakaru kanāls; papildu sirdsdarbÄ«bas pārbaudei tiek izmantota Ä«paÅ”a 1GbE saite. Caur to tiek pārraidÄ«ti tikai sirdspuksti, tāpēc ātruma raksturlielumiem prasÄ«bas nav izvirzÄ«tas.

Sistēmas jaudas palielināŔanas gadÄ«jumā (lÄ«dz 400+TB) sakarā ar izpleÅ”anās plaukti tie ir arÄ« savienoti pa pāriem, lai saglabātu jēdzienu ā€œnav viena atteices punktaā€.

Papildu datu aizsardzÄ«bai (papildus tam, ka AccelStor jau ir divas kopijas), jebkura SSD atteices gadÄ«jumā tiek izmantots Ä«paÅ”s uzvedÄ«bas algoritms. Ja SSD neizdodas, mezgls sāks atjaunot datus vienā no karstajiem rezerves diskdziņiem. FlexiRemap grupa, kas ir degradētā stāvoklÄ«, pārslēgsies uz tikai lasÄ«Å”anas režīmu. Tas tiek darÄ«ts, lai novērstu traucējumus starp ierakstÄ«Å”anas un atjaunoÅ”anas darbÄ«bām dublējuma diskā, kas galu galā paātrina atkopÅ”anas procesu un samazina laiku, kad sistēma ir potenciāli neaizsargāta. Pēc pārbÅ«ves pabeigÅ”anas mezgls atgriežas normālā lasÄ«Å”anas-rakstÄ«Å”anas režīmā.

Samaziniet dīkstāves riskus, izmantojot Shared Nothing arhitektūru

Protams, tāpat kā citām sistēmām, pārbÅ«ves laikā kopējā veiktspēja samazinās (galu galā viena no FlexiRemap grupām nedarbojas ierakstÄ«Å”anai). Taču pats atkopÅ”anas process notiek pēc iespējas ātrāk, kas atŔķir AccelStor sistēmas no citu piegādātāju risinājumiem.

Vēl viena noderÄ«ga Nothing Shared arhitektÅ«ras tehnoloÄ£ijas Ä«paŔība ir mezglu darbÄ«ba tā sauktajā patiesi aktÄ«vajā-aktÄ«vajā režīmā. AtŔķirÄ«bā no ā€œklasiskāsā€ arhitektÅ«ras, kur tikai vienam kontrollerim pieder noteikts sējums/pÅ«ls, bet otrais sistēmās vienkārÅ”i veic I/O darbÄ«bas. AccelStor katrs mezgls strādā ar savu datu kopu un nepārsÅ«ta pieprasÄ«jumus savam ā€œkaimiņamā€. Tā rezultātā tiek uzlabota kopējā sistēmas veiktspēja, pateicoties paralēlai I/O pieprasÄ«jumu apstrādei mezglos un piekļuvei diskdziņiem. Tāpat praktiski nav tādas lietas kā kļūmjpārlēce, jo kļūmes gadÄ«jumā vienkārÅ”i nav nepiecieÅ”ams nodot apjomu kontroli citam mezglam.

Ja salÄ«dzinām Nothing Shared arhitektÅ«ras tehnoloÄ£iju ar pilnvērtÄ«gu uzglabāŔanas sistēmas dublÄ“Å”anu, tad, no pirmā acu uzmetiena, tā elastÄ«bā bÅ«s nedaudz zemāka par pilnÄ«gu katastrofu atkopÅ”anas ievieÅ”anu. Tas jo Ä«paÅ”i attiecas uz sakaru lÄ«nijas organizÄ“Å”anu starp uzglabāŔanas sistēmām. Tādējādi H710 modelÄ« ir iespējams izplatÄ«t mezglus lÄ«dz 100m attālumā, izmantojot ne pārāk lētus InfiniBand aktÄ«vos optiskos kabeļus. Bet pat ja salÄ«dzina ar parasto sinhronās replikācijas ievieÅ”anu no citiem piegādātājiem, izmantojot pieejamo FibreChannel, pat lielākos attālumos, AccelStor risinājums bÅ«s lētāks un vieglāk uzstādāms/darbināms, jo nav jāinstalē krātuves virtualizatori un/vai jāintegrē ar programmatÅ«ru (kas principā ne vienmēr ir iespējams). Turklāt neaizmirstiet, ka AccelStor risinājumi ir visi Flash masÄ«vi, kuru veiktspēja ir augstāka nekā ā€œklasiskajāmā€ uzglabāŔanas sistēmām ar tikai SSD.

Samaziniet dīkstāves riskus, izmantojot Shared Nothing arhitektūru

Izmantojot AccelStor Nothing Shared arhitektūru, ir iespējams sasniegt 99.9999% krātuves sistēmas pieejamību par ļoti saprātīgām izmaksām. Līdzās risinājuma augstajai uzticamībai, tostarp izmantojot divas datu kopijas, un iespaidīgo veiktspēju, pateicoties patentētiem algoritmiem FlexiRemap, risinājumi no AccelStor ir lieliski kandidāti uz galvenajiem amatiem, veidojot modernu datu centru.

Avots: www.habr.com

Pievieno komentāru