Znížte riziká prestojov vďaka architektúre Shared Nothing

Téma odolnosti proti chybám v systémoch na ukladanie dát je vždy aktuálna, keďže v našej dobe rozšírenej virtualizácie a konsolidácie zdrojov sú práve úložné systémy spojovacím článkom, ktorého zlyhanie povedie nielen k bežnej nehode, ale aj k dlhodobému výpadku služieb. Preto moderné úložné systémy obsahujú veľa duplicitných komponentov (dokonca aj ovládačov). Je však takáto ochrana dostatočná?

Znížte riziká prestojov vďaka architektúre Shared Nothing

Absolútne všetci predajcovia pri uvádzaní charakteristík úložných systémov vždy uvádzajú vysokú odolnosť svojich riešení voči chybám a vždy pridávajú výraz „bez jediného bodu zlyhania“. Pozrime sa bližšie na typický úložný systém. Aby sa predišlo výpadkom pri údržbe, úložný systém duplikuje napájacie zdroje, chladiace moduly, vstupno/výstupné porty, disky (myslíme RAID) a samozrejme radiče. Ak sa pozriete pozorne na túto architektúru, všimnete si aspoň dva potenciálne body zlyhania, o ktorých sa skromne mlčí:

  1. Dostupnosť jednej základnej dosky
  2. Mať jednu kópiu údajov

Základná doska je technicky zložité zariadenie, ktoré musí počas výroby prejsť serióznym testovaním. A preto sú mimoriadne zriedkavé prípady, keď úplne zlyhá. Aj v prípade čiastkových problémov, ako je napríklad nefunkčný slot pre mechaniku, však bude potrebné nahradiť ho úplným odstavením úložného systému.

Vytváranie viacerých kópií dát tiež nie je na prvý pohľad problém. Pomerne rozšírená je napríklad funkcionalita Clone v úložných systémoch, ktorá umožňuje v určitých intervaloch aktualizovať úplnú kópiu údajov. V prípade problémov s rovnakým backplayom však bude kópia rovnako nedostupná ako originál.

Úplne samozrejmým riešením na prekonanie týchto nedostatkov je replikácia na iný úložný systém. Ak prižmúrime oči pred očakávaným zdvojnásobením nákladov na hardvér (stále predpokladáme, že ľudia, ktorí sa takto rozhodnú, rozmýšľajú adekvátne a akceptujú túto skutočnosť vopred), stále budú existovať možné náklady na organizáciu replikácie vo forme licencií, dodatočných softvér a hardvér. A čo je najdôležitejšie, budete musieť nejakým spôsobom zabezpečiť konzistenciu replikovaných údajov. Tie. vybudovať virtualizátor úložiska/vSAN/atď., čo si tiež vyžaduje finančné a časové zdroje.

AccelStor Pri vytváraní našich High Availability systémov sme si dali za cieľ zbaviť sa vyššie spomínaných nedostatkov. Takto sa objavila interpretácia technológie Shared Nothing, ktorá vo voľnom preklade znamená „bez použitia zdieľaných zariadení“.

Pojem Zdieľané nič architektúra predstavuje použitie dvoch nezávislých uzlov (kontrolérov), z ktorých každý má svoju vlastnú množinu dát. Synchrónna replikácia prebieha medzi uzlami cez rozhranie InfiniBand 56G, úplne transparentná pre softvér bežiaci na úložnom systéme. V dôsledku toho nie je potrebné používať virtualizátory úložísk, softvérových agentov atď.

Fyzicky možno dvojuzlové riešenie od AccelStor implementovať v dvoch modeloch:

  • H510 — založené na Twin serveroch v skrini 2U, ak sa vyžaduje mierny výkon a kapacita do 22 TB;
  • H710 — na základe jednotlivých 2U serverov, ak sa vyžaduje vysoký výkon a veľká kapacita (až 57 TB).

Znížte riziká prestojov vďaka architektúre Shared Nothing

Model H510 založený na serveri Twin

Znížte riziká prestojov vďaka architektúre Shared Nothing

Model H710 založený na jednotlivých serveroch

Použitie rôznych tvarových faktorov je spôsobené potrebou rôznych počtov SSD diskov na dosiahnutie daného objemu a výkonu. Platforma Twin je navyše lacnejšia a umožňuje vám ponúkať cenovo dostupnejšie riešenia, aj keď s určitými podmienenými „nevýhodami“ vo forme jednej základnej dosky. Všetko ostatné vrátane princípov fungovania je pre oba modely úplne identické.

Súbor údajov pre každý uzol má dve skupiny FlexiRemap, plus 2 horúce náhradné diely. Každá skupina je schopná odolať zlyhaniu jedného SSD. Všetky prichádzajúce požiadavky na zaznamenanie uzla v súlade s ideológie FlexiRemap prestavuje 4KB bloky do sekvenčných reťazcov, ktoré sa následne zapisujú na SSD v pre nich najpohodlnejšom režime (sekvenčné nahrávanie). Hostiteľ navyše dostane potvrdenie o nahrávaní až po fyzickom umiestnení údajov na SSD, t.j. bez ukladania do pamäte RAM. Výsledkom je veľmi pôsobivý výkon až 600K IOPS zápisu a 1M+ IOPS čítania (model H710).

Ako už bolo spomenuté, dátové súbory sa synchronizujú v reálnom čase cez rozhranie InfiniBand 56G, ktoré má vysokú priepustnosť a nízku latenciu. Aby sa čo najefektívnejšie využil komunikačný kanál pri prenose malých paketov. Pretože Existuje len jeden komunikačný kanál, na dodatočnú kontrolu srdcovej frekvencie sa používa vyhradené prepojenie 1GbE. Prenáša sa cez ňu iba tep, takže nie sú kladené žiadne požiadavky na rýchlostné charakteristiky.

V prípade zvýšenia kapacity systému (až 400+TB) z dôvodu rozširujúce police sú tiež spojené v pároch, aby sa zachovala koncepcia „bez jediného bodu zlyhania“.

Pre dodatočnú ochranu údajov (okrem toho, že AccelStor už má dve kópie), sa v prípade zlyhania ktoréhokoľvek SSD používa špeciálny algoritmus správania. Ak SSD zlyhá, uzol začne prestavovať dáta na jeden z horúcich náhradných diskov. Skupina FlexiRemap, ktorá je v degradovanom stave, sa prepne do režimu len na čítanie. Toto sa robí s cieľom eliminovať interferenciu medzi operáciami zápisu a obnovy na záložnom disku, čo v konečnom dôsledku urýchľuje proces obnovy a skracuje čas, kedy je systém potenciálne zraniteľný. Po dokončení prestavby sa uzol vráti do normálneho režimu čítania a zápisu.

Znížte riziká prestojov vďaka architektúre Shared Nothing

Samozrejme, ako pri iných systémoch, pri prestavbe celkový výkon klesá (napokon jedna zo skupín FlexiRemap nefunguje pre nahrávanie). Samotný proces obnovy však prebieha čo najrýchlejšie, čo odlišuje systémy AccelStor od riešení od iných predajcov.

Ďalšou užitočnou vlastnosťou technológie architektúry Nothing Shared je prevádzka uzlov v takzvanom true active-active mode. Na rozdiel od „klasickej“ architektúry, kde iba jeden radič vlastní konkrétny zväzok/pool a druhý jednoducho vykonáva I/O operácie, v systémoch AccelStor každý uzol pracuje s vlastným súborom údajov a neprenáša požiadavky svojmu „susedovi“. Výsledkom je zlepšenie celkového výkonu systému vďaka paralelnému spracovaniu I/O požiadaviek uzlami a prístupu k jednotkám. V podstate neexistuje nič také ako núdzové prepnutie, pretože v prípade zlyhania jednoducho nie je potrebné prenášať kontrolu nad zväzkami na iný uzol.

Ak porovnáme technológiu architektúry Nothing Shared s plnohodnotnou duplikáciou úložného systému, potom bude na prvý pohľad o niečo nižšia ako úplná implementácia obnovy po havárii vo flexibilite. To platí najmä pre organizáciu komunikačnej linky medzi úložnými systémami. V modeli H710 je teda možné rozložiť uzly na vzdialenosť až 100 m pomocou nie veľmi lacných aktívnych optických káblov InfiniBand. Ale aj v porovnaní s bežnou implementáciou synchrónnej replikácie od iných dodávateľov prostredníctvom dostupného FibreChannelu aj na väčšie vzdialenosti bude riešenie od AccelStor lacnejšie a jednoduchšie na inštaláciu/prevádzkovanie, pretože nie je potrebné inštalovať virtualizéry úložiska a/alebo integrovať softvér (čo nie je v princípe vždy možné). Navyše nezabudnite, že riešenia AccelStor sú All Flash polia s vyšším výkonom ako majú „klasické“ úložné systémy len s SSD.

Znížte riziká prestojov vďaka architektúre Shared Nothing

Pri použití architektúry Nothing Shared AccelStor je možné dosiahnuť 99.9999% dostupnosť úložného systému za veľmi rozumnú cenu. Spolu s vysokou spoľahlivosťou riešenia, a to aj vďaka použitiu dvoch kópií údajov, a pôsobivým výkonom vďaka proprietárnym algoritmom FlexiRemap, riešenia od AccelStor sú výbornými kandidátmi na kľúčové pozície pri budovaní moderného dátového centra.

Zdroj: hab.com

Pridať komentár