Snižte rizika prostojů s architekturou Shared Nothing

Téma odolnosti proti chybám v systémech ukládání dat je vždy aktuální, protože v naší době rozsáhlé virtualizace a konsolidace zdrojů jsou úložné systémy spojnicí, jejíž selhání povede nejen k běžné havárii, ale k dlouhodobému výpadku služeb. Moderní úložné systémy proto obsahují mnoho duplicitních komponent (dokonce i řadičů). Je ale taková ochrana dostatečná?

Snižte rizika prostojů s architekturou Shared Nothing

Naprosto všichni prodejci při výčtu charakteristik úložných systémů vždy zmiňují vysokou odolnost svých řešení proti chybám a vždy přidávají termín „bez jediného bodu selhání“. Pojďme se blíže podívat na typický úložný systém. Aby nedocházelo k prostojům při údržbě, úložný systém duplikuje napájecí zdroje, chladicí moduly, vstupní/výstupní porty, disky (máme na mysli RAID) a samozřejmě řadiče. Pokud se na tuto architekturu podíváte pozorně, všimnete si alespoň dvou potenciálních chyb, o kterých se skromně mlčí:

  1. Dostupnost jedné základní desky
  2. Mít jednu kopii dat

Základní deska je technicky složité zařízení, které musí během výroby projít vážným testováním. A proto jsou extrémně vzácné případy, kdy úplně selže. I v případě dílčích problémů, jako je například nefunkční slot pro mechaniku, však bude potřeba jej nahradit úplným odstavením úložného systému.

Vytváření více kopií dat také není na první pohled problém. Poměrně rozšířená je například funkcionalita Clone v úložných systémech, která umožňuje v určitých intervalech aktualizovat kompletní kopii dat. V případě problémů se stejným backplayem však bude kopie stejně nedostupná jako originál.

Zcela zřejmým řešením, jak tyto nedostatky překonat, je replikace na jiný úložný systém. Pokud přimhouříme oči před očekávaným zdvojnásobením nákladů na hardware (stále předpokládáme, že lidé při výběru takového rozhodnutí uvažují adekvátně a předem tuto skutečnost akceptují), stále budou existovat možné náklady na organizaci replikace v podobě licencí, dodatečné software a hardware. A co je nejdůležitější, budete muset nějak zajistit konzistenci replikovaných dat. Tito. vybudovat virtualizér úložiště/vSAN/atd., což také vyžaduje finanční a časové zdroje.

AccelStor Při vytváření našich systémů High Availability jsme si dali za cíl zbavit se výše zmíněných nedostatků. Tak se objevila interpretace technologie Shared Nothing, což volně přeloženo znamená „bez použití sdílených zařízení“.

Koncepce Sdíleno nic architektura představuje použití dvou nezávislých uzlů (řadičů), z nichž každý má svou vlastní sadu dat. K synchronní replikaci mezi uzly dochází prostřednictvím rozhraní InfiniBand 56G, což je zcela transparentní pro software běžící na úložném systému. V důsledku toho není vyžadováno použití virtualizátorů úložiště, softwarových agentů atd.

Fyzicky lze dvouuzlové řešení od AccelStor implementovat ve dvou modelech:

  • H510 — založeno na Twin serverech v pouzdře 2U, pokud je vyžadován střední výkon a kapacita až 22 TB;
  • H710 — na základě jednotlivých 2U serverů, pokud je vyžadován vysoký výkon a velká kapacita (až 57 TB).

Snižte rizika prostojů s architekturou Shared Nothing

Model H510 založený na Twin serveru

Snižte rizika prostojů s architekturou Shared Nothing

Model H710 založený na jednotlivých serverech

Použití různých tvarových faktorů je způsobeno potřebou různého počtu SSD pro dosažení daného objemu a výkonu. Platforma Twin je navíc levnější a umožňuje vám nabízet cenově dostupnější řešení, i když s určitou podmíněnou „nevýhodou“ v podobě jedné základní desky. Vše ostatní včetně principů fungování je u obou modelů zcela shodné.

Sada dat pro každý uzel má dvě skupiny FlexiRemap, plus 2 horké náhradní díly. Každá skupina je schopna odolat výpadku jednoho SSD. Všechny příchozí požadavky na záznam uzlu v souladu s ideologie FlexiRemap přebudovává 4KB bloky do sekvenčních řetězců, které se pak zapisují na SSD v pro ně nejpohodlnějším režimu (sekvenční nahrávání). Host navíc obdrží potvrzení o nahrávání až poté, co jsou data fyzicky umístěna na SSD, tzn. bez ukládání do mezipaměti v RAM. Výsledkem je velmi působivý výkon až 600K IOPS zápisu a 1M+ IOPS čtení (model H710).

Jak již bylo zmíněno dříve, datové sady jsou synchronizovány v reálném čase prostřednictvím rozhraní InfiniBand 56G, které má vysokou propustnost a nízkou latenci. Aby bylo možné co nejefektivněji využít komunikační kanál při přenosu malých paketů. Protože Komunikační kanál je pouze jeden, pro další kontrolu srdeční frekvence se používá vyhrazený 1GbE spoj. Přes něj se přenáší pouze srdeční tep, takže nejsou žádné požadavky na rychlostní charakteristiky.

V případě zvýšení kapacity systému (až 400+TB) z důvodu rozšiřovací police jsou také spojeny ve dvojicích, aby byl zachován koncept „žádný jediný bod selhání“.

Pro dodatečnou ochranu dat (kromě toho, že AccelStor již má dvě kopie) se používá speciální algoritmus chování v případě selhání libovolného SSD. Pokud SSD selže, uzel začne znovu sestavovat data na jeden z horkých náhradních disků. Skupina FlexiRemap, která je v degradovaném stavu, se přepne do režimu pouze pro čtení. To se provádí za účelem odstranění interference mezi operacemi zápisu a obnovy na záložním disku, což v konečném důsledku urychluje proces obnovy a zkracuje dobu, kdy je systém potenciálně zranitelný. Po dokončení přestavby se uzel vrátí do normálního režimu čtení a zápisu.

Snižte rizika prostojů s architekturou Shared Nothing

Samozřejmě, jako u jiných systémů, při přestavbě celkový výkon klesá (přece jen jedna ze skupin FlexiRemap nefunguje pro nahrávání). Samotný proces obnovy však probíhá co nejrychleji, což odlišuje systémy AccelStor od řešení od jiných dodavatelů.

Další užitečnou vlastností technologie architektury Nothing Shared je provoz uzlů v tzv. true active-active mode. Na rozdíl od „klasické“ architektury, kde pouze jeden řadič vlastní konkrétní svazek/pool a druhý jednoduše provádí I/O operace, v systémech AccelStor každý uzel pracuje s vlastní sadou dat a nepřenáší požadavky svému „sousedovi“. Výsledkem je zlepšení celkového výkonu systému díky paralelnímu zpracování I/O požadavků uzly a přístupu k jednotkám. Také prakticky neexistuje nic jako převzetí služeb při selhání, protože v případě selhání jednoduše není potřeba přenášet kontrolu nad svazky na jiný uzel.

Pokud porovnáme technologii architektury Nothing Shared s plnohodnotnou duplikací úložného systému, bude na první pohled o něco horší než plná implementace obnovy po havárii ve flexibilitě. To platí zejména pro organizaci komunikační linky mezi úložnými systémy. V modelu H710 je tak možné rozmístit uzly na vzdálenost až 100 m pomocí nepříliš levných aktivních optických kabelů InfiniBand. Ale i ve srovnání s obvyklou implementací synchronní replikace od jiných dodavatelů prostřednictvím dostupného FibreChannelu, a to i na delší vzdálenosti, bude řešení od AccelStor levnější a snadněji se instaluje/provozuje, protože není potřeba instalovat virtualizéry úložiště a/nebo integrovat se softwarem (což není v zásadě vždy možné). Navíc nezapomeňte, že řešení AccelStor jsou All Flash pole s výkonem vyšším než u „klasických“ úložných systémů pouze s SSD.

Snižte rizika prostojů s architekturou Shared Nothing

Při použití architektury Nothing Shared AccelStor je možné dosáhnout 99.9999% dostupnosti úložného systému za velmi rozumnou cenu. Spolu s vysokou spolehlivostí řešení, mimo jiné díky použití dvou kopií dat, a působivým výkonem díky proprietárním algoritmům FlexiRemap, řešení od AccelStor jsou vynikajícími kandidáty na klíčové pozice při budování moderního datového centra.

Zdroj: www.habr.com

Přidat komentář