Huawei Dorado V6: Sečuánské teplo

Huawei Dorado V6: Sečuánské teplo
Letošní léto v Moskvě, upřímně řečeno, nebylo moc dobré. Začalo to příliš brzy a rychle, ne každý na to stihl zareagovat a skončilo to už na konci června. Proto, když mě Huawei pozval do Číny, do města Chengdu, kde se nachází jejich RnD centrum, po shlédnutí předpovědi počasí +34 stupňů ve stínu jsem okamžitě souhlasil. Přece jen už nejsem stejně starý a potřebuji si trochu zahřát kosti. Rád bych ale poznamenal, že se podařilo prohřát nejen kosti, ale i vnitřnosti, protože provincie S'-čchuan, ve které se Čcheng-tu skutečně nachází, je proslulá svou zálibou v pálivém jídle. Ale stále to není blog o cestování, takže se vraťme k hlavnímu cíli naší cesty - nové řadě úložných systémů - Huawei Dorado V6. Tento článek s vámi trochu zamává z minulosti, protože... bylo napsáno před oficiálním oznámením, ale zveřejněno až po vydání. A tak se dnes blíže podíváme na vše zajímavé a chutné, co si pro nás Huawei připravil.

Huawei Dorado V6: Sečuánské teplo
V nové řadě bude 5 modelů. Všechny modely kromě 3000V6 lze mít ve dvou verzích - SAS a NVMe. Volba určuje rozhraní disků, které můžete v tomto systému používat, porty Back-End a počet diskových jednotek, které můžete do systému nainstalovat. Pro NVMe se používají SSD velikosti Palm, které jsou tenčí než klasické 2.5“ SAS SSD a lze je nainstalovat až po 36 kusech. Nová řada je All Flash a neexistují žádné konfigurace s disky.

Huawei Dorado V6: Sečuánské teplo
Palm NVMe SSD

Dle mého názoru jako nejzajímavější modely vypadají Dorado 8000 a 18000. Huawei je řadí mezi High-end systémy a díky cenové politice Huawei tyto modely střední třídy staví do kontrastu s konkurenčním segmentem. Právě na tyto modely se zaměřím ve své dnešní recenzi. Hned poznamenám, že vzhledem ke svým konstrukčním vlastnostem mají juniorské dvouřadé systémy trochu odlišnou architekturu, odlišnou od Dorado 8000 a 18000, takže ne vše, o čem dnes budu mluvit, je použitelné pro juniorské modely.

Jedním z hlavních rysů nových systémů bylo použití několika vlastních čipů, z nichž každý vám umožňuje distribuovat logickou zátěž z centrálního procesoru ovladače a přidávat funkce různým komponentám.
Huawei Dorado V6: Sečuánské teplo

Srdcem nových systémů jsou procesory Kunpeng 920, vyvinuté na technologiích ARM a vyráběné společností Huawei nezávisle. V závislosti na modelu se počet jader, jejich frekvence a počet nainstalovaných procesorů v každém řadiči liší:
Huawei Dorado V6 8000 – 2CPU, 64jádrový
Huawei Dorado V6 18000 – 4CPU, 48jádrový
Huawei Dorado V6: Sečuánské teplo

Huawei tento procesor vyvíjel na architektuře ARM a pokud vím, původně plánoval jeho instalaci pouze do starších modelů Dorado 8000 a 18000, jak tomu již bylo u některých modelů V5, ale sankce tento nápad upravily. ARM samozřejmě při uvalování sankcí mluvil i o odmítnutí spolupráce s Huawei, ale tady je situace jiná než u Intelu. Huawei vyrábí tyto čipy nezávisle a žádné sankce nemohou tento proces zastavit. Přerušení vztahů s ARM ohrožuje pouze ztrátu přístupu k novému vývoji. Pokud jde o výkon, bude možné posoudit až po provedení nezávislých testů. I když jsem viděl, jak byl 18000M IOPS bez problémů odstraněn ze systému Dorado 1, dokud to nezopakuji vlastníma rukama ve svém racku, nebudu tomu věřit. Ale v ovladačích je opravdu hodně síly. Starší modely jsou vybaveny 4 řadiči, každý se 4 procesory, což dává dohromady 768 jader.
Huawei Dorado V6: Sečuánské teplo

O jádrech ale budu mluvit ještě později, až se podíváme na architekturu nových systémů, ale vraťme se prozatím k dalšímu čipu nainstalovanému v systému. Čip vypadá jako mimořádně zajímavé řešení Vystoupejte 310 (Pokud jsem pochopil, mladší bratr Ascendu 910, který byl nedávno představen veřejnosti). Jeho úkolem je analyzovat datové bloky vstupující do systému, aby se zvýšil poměr čtení. Těžko říct, jak to bude fungovat v práci, protože... Dnes funguje pouze podle dané šablony a nemá schopnost učit se v inteligentním režimu. Vzhled inteligentního režimu je přislíben v budoucím firmwaru, pravděpodobně začátkem příštího roku.

Přejděme k architektuře. Huawei pokračuje ve vývoji vlastní technologie Smart Matrix, která implementuje plně síťový přístup k propojování komponent. Ale pokud to bylo ve V5 pouze pro přístup z řadičů k diskům, nyní mají všechny řadiče přístup ke všem portům na back-endu i front-endu.
Huawei Dorado V6: Sečuánské teplo

Díky nové architektuře mikroslužeb to také umožňuje vyvažování zátěže mezi všemi ovladači, i když je pouze jeden lun. Operační systém pro tuto řadu polí byl vyvinut od základů a nebyl jednoduše optimalizován pro použití flash disků. Vzhledem k tomu, že všechny naše řadiče mají přístup ke stejným portům, v případě selhání řadiče nebo restartu hostitel neztratí jedinou cestu k úložnému systému a přepínání cest se provádí na úrovni úložného systému. Použití UltraPath na hostiteli však není nezbytně nutné. Další „úsporou“ při instalaci systému je menší počet potřebných odkazů. A pokud při „klasickém“ přístupu pro 4 ovladače budeme potřebovat 8 linek ze 2 továren, tak v případě Huawei budou stačit i 2 (nemluvím teď o dostatku propustnosti jednoho linku).
Huawei Dorado V6: Sečuánské teplo

Stejně jako v předchozí verzi je použita globální mezipaměť se zrcadlením. To vám umožní ztratit až dva ovladače současně nebo tři ovladače postupně bez ovlivnění dostupnosti. Sluší se ale podotknout, že kompletní vyvažování zátěže mezi zbylými 3 ovladači jsme v případě jednoho selhání na demo stánku neviděli. Zátěž porouchaného ovladače zcela převzal jeden ze zbývajících. Je možné, že k tomu je nutné nechat systém v této konfiguraci pracovat déle. V každém případě si to podrobněji ověřím pomocí vlastních testů.
Huawei umisťuje nové systémy jako End-to-End NVMe systémy, ale dnes NVMeOF ještě není podporováno na frontendu, pouze FC, iSCSI nebo NFS. Na konci tohoto nebo na začátku příštího, stejně jako u jiných funkcí, máme slíbenou podporu RoCE.
Huawei Dorado V6: Sečuánské teplo

Police jsou také připojeny k ovladačům pomocí RoCE a s tím je spojena jedna nevýhoda - absence „loopback“ spojení polic, jako tomu bylo u SAS. To je podle mého názoru stále poměrně velký nedostatek, pokud plánujete poměrně velký systém. Faktem je, že všechny police jsou zapojeny do série a selhání jedné z polic má za následek úplnou nepřístupnost všech ostatních, které na ni navazují. V tomto případě, abychom zajistili odolnost proti chybám, budeme muset všechny police připojit k řadičům, což s sebou nese zvýšení požadovaného počtu backendových portů v systému.

A ještě jedna věc, která stojí za zmínku, je non-disruptive update (NDU). Jak jsem řekl výše, Huawei implementoval kontejnerový přístup k provozu operačního systému pro novou řadu Dorado, což vám umožňuje aktualizovat a restartovat služby bez nutnosti úplného restartu ovladače. Hned je třeba zmínit, že některé aktualizace budou obsahovat aktualizace jádra a v tomto případě bude během aktualizace někdy stále vyžadován klasický restart řadičů, ale ne vždy. Tím se sníží dopad této operace na produktivní systém.

V našem arzenálu je naprostá většina polí z NetApp. Proto si myslím, že bude celkem logické, když provedu malé srovnání se systémy, se kterými musím poměrně hodně pracovat. Nejde o snahu určovat, kdo je lepší a kdo horší nebo čí architektura je výhodnější. Pokusím se střízlivě a bez fanatismu porovnat dva různé přístupy k řešení stejného problému od různých prodejců. Ano, samozřejmě, v tomto případě budeme zvažovat systémy Huawei v „teorii“ a také samostatně zaznamenám ty body, které se plánují implementovat v budoucích verzích firmwaru. Jaké výhody v tuto chvíli vidím:

  1. Počet podporovaných jednotek NVMe. NetApp jich má aktuálně 288, zatímco Huawei 1600-6400 v závislosti na modelu. Maximální využitelná kapacita Huawei je zároveň 32 PBe, stejně jako systémy NetApp (přesněji mají 31.64 PBe). A to i přesto, že jsou podporovány disky stejného objemu (až 15Tb). Huawei tuto skutečnost vysvětluje následovně: neměli možnost sestavit větší stojan. Teoreticky nemají žádné omezení objemu, ale tuto skutečnost prostě ještě nemohli otestovat. Zde však stojí za zmínku, že možnosti flash disků jsou dnes velmi vysoké a v případě systémů NVMe se potýkáme se skutečností, že 24 disků stačí k využití špičkového 2-řadičového systému. Další zvýšení počtu disků v systému tedy nejenže nepřinese zvýšení výkonu, ale bude mít také špatný vliv na poměr IOPS/Tb. Samozřejmě stojí za to vidět, kolik pohonů zvládnou 4-řadičové systémy 8000 a 16000, protože... Schopnosti a potenciál Kunpengu 920 stále nejsou zcela jasné.
  2. Přítomnost Lun jako vlastníka systémů NetApp. Tito. Pouze jeden ovladač může provádět operace s měsícem, zatímco druhý pouze prochází IO přes sebe. Systémy Huawei naopak nemají žádné vlastníky a operace s datovými bloky (komprese, deduplikace) může provádět kterýkoli z řadičů, stejně jako zapisovat na disky.
  3. Žádný port neklesne, když jeden z řadičů selže. Pro některé tento okamžik vypadá extrémně kriticky. Pointa je, že přepínání uvnitř úložného systému by mělo probíhat rychleji než na straně hostitele. A pokud jsme v případě stejného NetAppu v praxi zjistili zamrznutí cca 5 sekund při vytahování ovladače a přepínání cest, tak s přechodem na Huawei musíme ještě cvičit.
  4. Při aktualizaci není třeba restartovat ovladač. Zejména mě to začalo znepokojovat s poměrně častým vydáváním nových verzí a větví firmwaru pro NetApps. Ano, některé aktualizace pro Huawei budou stále vyžadovat restart, ale ne všechny.
  5. 4 ovladače Huawei za cenu dvou ovladačů NetApp. Jak jsem řekl výše, díky cenové politice Huawei může konkurovat střední třídě se svými High-end modely.
  6. Přítomnost dalších čipů v řadičích polic a portových kartách, které jsou potenciálně určeny ke zlepšení účinnosti systému.

Nevýhody a obavy obecně:

  1. Přímé připojení polic k ovladačům nebo potřeba velkého počtu back-end portů pro připojení všech polic k ovladačům.
  2. Architektura ARM a přítomnost velkého množství čipů - jak efektivně bude fungovat a bude výkon stačit?

Většinu obav a obav lze rozptýlit osobním testováním nové řady. Doufám, že se brzy po vydání objeví v Moskvě a bude jich dost na to, abyste si jeden rychle pořídili pro vlastní testy. Zatím můžeme říci, že obecně přístup společnosti vypadá zajímavě a nová řada vypadá ve srovnání s jejími konkurenty velmi dobře. Konečná implementace vyvolává spoustu otázek, protože Mnoho věcí uvidíme až na konci roku a možná až v roce 2020.

Zdroj: www.habr.com

Přidat komentář