Huawei Dorado V6: Sečuánske teplo

Huawei Dorado V6: Sečuánske teplo
Leto v Moskve tento rok, úprimne povedané, nebolo veľmi dobré. Začalo to príliš skoro a rýchlo, nie každý na to stihol zareagovať a skončilo to už koncom júna. Preto, keď ma Huawei pozval do Číny, do mesta Chengdu, kde sa nachádza ich RnD centrum, po zhliadnutí predpovede počasia +34 stupňov v tieni som okamžite súhlasil. Koniec koncov, už nemám rovnaký vek a potrebujem si trochu zahriať kosti. Ale rád by som poznamenal, že sa podarilo ohriať nielen kosti, ale aj vnútro, pretože provincia S'-čchuan, v ktorej sa Čcheng-tu v skutočnosti nachádza, je známa svojou záľubou v pikantných jedlách. Toto však stále nie je blog o cestovaní, takže sa vráťme k hlavnému cieľu našej cesty - novej rade úložných systémov - Huawei Dorado V6. Tento článok s vami trochu zamáva z minulosti, pretože... bol napísaný ešte pred oficiálnym oznámením, no zverejnený až po vydaní. A tak sa dnes bližšie pozrieme na všetko zaujímavé a chutné, čo si pre nás Huawei pripravil.

Huawei Dorado V6: Sečuánske teplo
V novom rade bude 5 modelov. Všetky modely okrem 3000V6 je možné mať v dvoch verziách - SAS a NVMe. Voľba určuje rozhranie diskov, ktoré môžete použiť v tomto systéme, porty Back-End a počet diskových jednotiek, ktoré môžete do systému nainštalovať. Pre NVMe sa používajú SSD veľkosti Palm, ktoré sú tenšie ako klasické 2.5“ SAS SSD a je možné ich nainštalovať až po 36 kusoch. Nový rad je All Flash a neexistujú žiadne konfigurácie s diskami.

Huawei Dorado V6: Sečuánske teplo
Palm NVMe SSD

Ako najzaujímavejšie modely podľa mňa vyzerajú Dorado 8000 a 18000. Huawei ich zaraďuje medzi High-end systémy a vďaka cenovej politike Huawei dáva tieto modely strednej triedy do kontrastu s konkurenčným segmentom. Práve týmto modelom sa budem v dnešnej recenzii venovať. Hneď si všimnem, že kvôli svojim konštrukčným vlastnostiam majú juniorské systémy s dvoma ovládačmi trochu inú architektúru, odlišnú od Dorado 8000 a 18000, takže nie všetko, o čom dnes hovorím, je použiteľné pre juniorské modely.

Jednou z hlavných čŕt nových systémov bolo použitie niekoľkých čipov, vyvinutých vo vlastnej réžii, z ktorých každý vám umožňuje distribuovať logickú záťaž z centrálneho procesora ovládača a pridať funkčnosť rôznym komponentom.
Huawei Dorado V6: Sečuánske teplo

Srdcom nových systémov sú procesory Kunpeng 920, vyvinuté na technológiách ARM a nezávisle vyrábané spoločnosťou Huawei. V závislosti od modelu sa počet jadier, ich frekvencia a počet nainštalovaných procesorov v každom radiči líšia:
Huawei Dorado V6 8000 – 2CPU, 64 jadier
Huawei Dorado V6 18000 – 4CPU, 48 jadier
Huawei Dorado V6: Sečuánske teplo

Huawei tento procesor vyvinul na architektúre ARM a pokiaľ viem, pôvodne ho plánoval osadiť len do starších modelov Dorado 8000 a 18000, ako to už bolo pri niektorých modeloch V5, no sankcie tento nápad upravili. ARM samozrejme hovoril aj o odmietnutí spolupráce s Huawei pri uvalení sankcií, no tu je situácia iná ako u Intelu. Huawei vyrába tieto čipy nezávisle a žiadne sankcie nemôžu tento proces zastaviť. Prerušenie vzťahov s ARM ohrozuje iba stratu prístupu k novému vývoju. Pokiaľ ide o výkon, bude možné posúdiť až po vykonaní nezávislých testov. Hoci som videl, ako bol 18000M IOPS bez problémov odstránený zo systému Dorado 1, kým to nezopakujem vlastnými rukami v mojom stojane, neuverím. Ale v ovládačoch je skutočne veľa sily. Staršie modely sú vybavené 4 radičmi, každý so 4 procesormi, čo dáva dokopy 768 jadier.
Huawei Dorado V6: Sečuánske teplo

Ale o jadrách budem hovoriť ešte neskôr, keď sa pozrieme na architektúru nových systémov, ale teraz sa vráťme k inému čipu nainštalovanému v systéme. Čip vyzerá ako mimoriadne zaujímavé riešenie Vzostup 310 (Pokiaľ som pochopil, mladší brat Ascend 910, ktorý bol nedávno predstavený verejnosti). Jeho úlohou je analyzovať dátové bloky vstupujúce do systému, aby sa zvýšil pomer čítania. Ťažko povedať, ako to bude fungovať v práci, pretože... Dnes funguje len podľa danej šablóny a nemá schopnosť učiť sa v inteligentnom režime. Vzhľad inteligentného režimu je sľúbený v budúcom firmvéri, s najväčšou pravdepodobnosťou začiatkom budúceho roka.

Prejdime k architektúre. Huawei pokračoval vo vývoji vlastnej technológie Smart Matrix, ktorá implementuje úplný sieťový prístup k spájaniu komponentov. Ale ak to bolo vo V5 len pre prístup z radičov na disky, teraz majú všetky radiče prístup ku všetkým portom na back-ende aj front-ende.
Huawei Dorado V6: Sečuánske teplo

Vďaka novej architektúre mikroslužieb to umožňuje aj vyrovnávanie záťaže medzi všetkými ovládačmi, aj keď je len jeden lun. Operačný systém pre tento rad polí bol vyvinutý od základov a nie je jednoducho optimalizovaný na použitie flash diskov. Vzhľadom na to, že všetky naše radiče majú prístup k rovnakým portom, v prípade zlyhania radiča alebo reštartu hostiteľ nestratí ani jednu cestu k úložnému systému a prepínanie ciest sa vykonáva na úrovni úložného systému. Použitie UltraPath na hostiteľovi však nie je nevyhnutne potrebné. Ďalšou „úsporou“ pri inštalácii systému je menší počet potrebných odkazov. A ak pri „klasickom“ prístupe pre 4 ovládače budeme potrebovať 8 liniek z 2 tovární, tak v prípade Huawei budú stačiť aj 2 (nehovorím teraz o dostatočnej priepustnosti jedného linku).
Huawei Dorado V6: Sečuánske teplo

Rovnako ako v predchádzajúcej verzii sa používa globálna vyrovnávacia pamäť so zrkadlením. To vám umožní stratiť až dva ovládače súčasne alebo tri ovládače postupne bez ovplyvnenia dostupnosti. Za zmienku ale stojí, že na demo stánku sme nevideli úplné vyvažovanie záťaže medzi zvyšnými 3 ovládačmi v prípade jedného zlyhania. Záťaž pokazeného ovládača úplne prevzal jeden zo zostávajúcich. Je možné, že na to je potrebné nechať systém v tejto konfigurácii pracovať dlhšie. V každom prípade si to preverím podrobnejšie pomocou vlastných testov.
Huawei umiestňuje nové systémy ako End-to-End NVMe systémy, ale dnes NVMeOF ešte nie je podporovaný na frontende, iba FC, iSCSI alebo NFS. Na konci tohto alebo na začiatku nasledujúceho, podobne ako pri iných funkciách, máme sľúbenú podporu RoCE.
Huawei Dorado V6: Sečuánske teplo

Regály sú tiež pripojené k ovládačom pomocou RoCE a s tým je spojená jedna nevýhoda - absencia „loopback“ spojenia políc, ako to bolo v prípade SAS. Podľa mňa je to stále dosť veľký nedostatok, ak plánujete dosť veľký systém. Faktom je, že všetky police sú zapojené do série a porucha jednej z políc má za následok úplnú nedostupnosť všetkých ostatných za ňou nasledujúcich. V tomto prípade, aby sme zabezpečili odolnosť voči chybám, budeme musieť pripojiť všetky police k radičom, čo znamená zvýšenie potrebného počtu backendových portov v systéme.

A ešte jedna vec, ktorá stojí za zmienku, je non-disruptive update (NDU). Ako som povedal vyššie, spoločnosť Huawei implementovala kontajnerový prístup k prevádzke OS pre novú líniu Dorado, čo vám umožňuje aktualizovať a reštartovať služby bez potreby úplného reštartu ovládača. Okamžite stojí za zmienku, že niektoré aktualizácie budú obsahovať aktualizácie jadra a v tomto prípade bude počas aktualizácie niekedy stále potrebný klasický reštart ovládačov, ale nie vždy. Tým sa zníži vplyv tejto operácie na produktívny systém.

V našom arzenáli je veľká väčšina polí z NetApp. Preto si myslím, že bude celkom logické, ak urobím malé porovnanie so systémami, s ktorými musím pomerne veľa pracovať. Nejde o pokus určiť, kto je lepší a kto horší alebo čia architektúra je výhodnejšia. Pokúsim sa triezvo a bez fanatizmu porovnať dva rôzne prístupy k riešeniu toho istého problému od rôznych predajcov. Áno, samozrejme, v tomto prípade zvážime systémy Huawei v „teórii“ a osobitne si všimnem aj tie body, ktoré sa plánujú implementovať v budúcich verziách firmvéru. Aké výhody momentálne vidím:

  1. Počet podporovaných jednotiek NVMe. NetApp ich má aktuálne 288, kým Huawei 1600-6400 v závislosti od modelu. Zároveň je maximálna využiteľná kapacita Huawei 32 PBe, rovnako ako systémy NetApp (presnejšie majú 31.64 PBe). A to aj napriek tomu, že sú podporované disky rovnakého objemu (do 15Tb). Huawei túto skutočnosť vysvetľuje takto: nemali možnosť zostaviť väčší stojan. Teoreticky nemajú žiadne obmedzenie objemu, ale túto skutočnosť jednoducho ešte nedokázali otestovať. Tu však stojí za zmienku, že možnosti flash diskov sú dnes veľmi vysoké a v prípade systémov NVMe sa stretávame so skutočnosťou, že 24 diskov stačí na využitie špičkového systému s 2 ovládačmi. Ďalšie zvýšenie počtu diskov v systéme teda nielenže neprinesie zvýšenie výkonu, ale bude mať aj zlý vplyv na pomer IOPS/Tb. Samozrejme, stojí za to vidieť, koľko pohonov zvládajú 4-regulačné systémy 8000 a 16000, pretože... Schopnosti a potenciál Kunpengu 920 stále nie sú úplne jasné.
  2. Prítomnosť spoločnosti Lun ako vlastníka systémov NetApp. Tie. Iba jeden ovládač môže vykonávať operácie s mesiacom, zatiaľ čo druhý iba prechádza IO cez seba. Systémy Huawei naopak nemajú žiadnych vlastníkov a operácie s dátovými blokmi (kompresia, deduplikácia) môže vykonávať ktorýkoľvek z radičov, ako aj zapisovať na disky.
  3. Žiadny port neklesne, keď jeden z ovládačov zlyhá. Pre niektorých tento moment vyzerá mimoriadne kriticky. Pointa je, že prepínanie vo vnútri úložného systému by malo prebiehať rýchlejšie ako na strane hostiteľa. A ak sme v prípade toho istého NetApp v praxi zistili zamrznutie okolo 5 sekúnd pri vyťahovaní ovládača a prepínaní ciest, tak s prechodom na Huawei musíme ešte trénovať.
  4. Pri aktualizácii nie je potrebné reštartovať ovládač. Najmä ma to začalo znepokojovať pomerne častým vydávaním nových verzií a vetiev firmvéru pre NetApps. Áno, niektoré aktualizácie pre Huawei budú stále vyžadovať reštart, ale nie všetky.
  5. 4 ovládače Huawei za cenu dvoch ovládačov NetApp. Ako som povedal vyššie, vďaka cenovej politike spoločnosti Huawei môže konkurovať strednej triede so svojimi špičkovými modelmi.
  6. Prítomnosť ďalších čipov v ovládačoch políc a portových kartách, ktoré sú potenciálne určené na zlepšenie efektívnosti systému.

Nevýhody a obavy vo všeobecnosti:

  1. Priame pripojenie políc k ovládačom alebo potreba veľkého počtu back-end portov na pripojenie všetkých políc k ovládačom.
  2. Architektúra ARM a prítomnosť veľkého počtu čipov - ako efektívne bude fungovať a bude dostatočný výkon?

Väčšinu obáv a obáv možno rozptýliť osobným testovaním novej línie. Dúfam, že čoskoro po vydaní sa objavia v Moskve a bude ich dosť na to, aby ste si ich rýchlo zohnali na vlastné testy. Zatiaľ môžeme povedať, že vo všeobecnosti prístup spoločnosti vyzerá zaujímavo a nový rad vyzerá v porovnaní s konkurenciou veľmi dobre. Konečná implementácia vyvoláva množstvo otázok, pretože Veľa vecí uvidíme až koncom roka a možno až v roku 2020.

Zdroj: hab.com

Pridať komentár