Huawei Dorado V6: Szecsuáni hőség

Huawei Dorado V6: Szecsuáni hőség
Az idei moszkvai nyár őszintén szólva nem volt túl jó. Túl korán és gyorsan kezdődött, nem mindenkinek volt ideje reagálni rá, és már június végén véget is ért. Ezért amikor a Huawei meghívott, hogy menjek Kínába, Csengtu városába, ahol az RnD központjuk található, miután megnéztem a +34 fokos időjárás-előrejelzést árnyékban, azonnal beleegyeztem. Hiszen már nem vagyok egyidős, és kicsit fel kell melegítenem a csontjaimat. De szeretném megjegyezni, hogy nem csak a csontokat, hanem a belsejét is fel lehetett melegíteni, mert Szecsuán tartomány, amelyben Chengdu valójában található, híres a fűszeres ételek iránti szeretetéről. De ez mégsem az utazásról szóló blog, úgyhogy térjünk vissza utazásunk fő céljához - a tárolórendszerek új sorozatához - a Huawei Dorado V6-hoz. Ez a cikk egy kicsit integet a múltból, mert... a hivatalos bejelentés előtt íródott, de csak a megjelenés után tették közzé. Tehát ma közelebbről megvizsgáljuk mindazt, ami érdekes és ízletes, amit a Huawei készített nekünk.

Huawei Dorado V6: Szecsuáni hőség
Az új sorozatban 5 modell lesz. A 3000V6 kivételével minden modell két változatban kapható - SAS és NVMe. A választás határozza meg a rendszerben használható lemezek interfészét, a Back-End portokat és a rendszerbe telepíthető lemezmeghajtók számát. Az NVMe-hez tenyér méretű SSD-ket használnak, amelyek vékonyabbak, mint a klasszikus 2.5"-es SAS SSD-k, és akár 36 darabban is beépíthetők. Az új sor az All Flash, és nincs lemezes konfiguráció.

Huawei Dorado V6: Szecsuáni hőség
Palm NVMe SSD

Véleményem szerint a Dorado 8000 és 18000 tűnnek a legérdekesebb modelleknek, a Huawei csúcskategóriás rendszerként pozicionálja őket, és a Huawei árpolitikájának köszönhetően szembeállítja ezeket a középkategóriás modelleket a versenytárs szegmenssel. A mai áttekintésemben ezekre a modellekre fogok összpontosítani. Rögtön megjegyzem, hogy tervezési jellemzőikből adódóan a junior dual-controller rendszerek kissé eltérő architektúrával rendelkeznek, eltér a Dorado 8000-től és 18000-től, így nem minden, amiről ma beszélek, alkalmazható a junior modellekre.

Az új rendszerek egyik fő jellemzője az volt, hogy több, házon belül kifejlesztett chipet használtak, amelyek mindegyike lehetővé teszi a vezérlő központi processzorának logikai terhelésének elosztását és a különböző komponensek funkcionalitásának hozzáadását.
Huawei Dorado V6: Szecsuáni hőség

Az új rendszerek szívét az ARM technológián alapuló Kunpeng 920 processzorok képezik, amelyeket a Huawei önállóan gyártott. A modelltől függően a magok száma, gyakorisága és az egyes vezérlőkbe telepített processzorok száma eltérő:
Huawei Dorado V6 8000 – 2 CPU, 64 mag
Huawei Dorado V6 18000 – 4 CPU, 48 mag
Huawei Dorado V6: Szecsuáni hőség

A Huawei ezt a processzort ARM architektúrára fejlesztette ki, és ha jól tudom, kezdetben csak a régebbi Dorado 8000 és 18000 modellekbe tervezte telepíteni, ahogy az már volt néhány V5 modellnél, de a szankciók módosították ezt az elképzelést. Természetesen az ARM arról is beszélt, hogy a szankciók kiszabásakor nem hajlandó együttműködni a Huawei-vel, de itt más a helyzet, mint az Intelnél. A Huawei ezeket a chipeket önállóan gyártja, és semmilyen szankció nem állíthatja meg ezt a folyamatot. Az ARM-mel való kapcsolatok megszakítása csak az új fejlesztésekhez való hozzáférés elvesztésével fenyeget. Ami a teljesítményt illeti, csak független tesztek elvégzése után lehet megítélni. Bár láttam, hogy az 18000M IOPS-t gond nélkül eltávolították a Dorado 1 rendszerből, de amíg meg nem ismétlem saját kezemmel a rackemben, addig nem hiszem el. De a vezérlőkben tényleg nagy az erő. A régebbi modellek 4 vezérlővel vannak felszerelve, mindegyik 4 processzorral, összesen 768 magot adva.
Huawei Dorado V6: Szecsuáni hőség

De a magokról még később, amikor az új rendszerek architektúráját nézzük, de most térjünk vissza egy másik, a rendszerbe telepített chiphez. A chip rendkívül érdekes megoldásnak tűnik Ascend 310 (Ha jól értem, az Ascend 910 öccse, amit nemrég mutattak be a nagyközönségnek). Feladata a rendszerbe belépő adatblokkok elemzése a Read hit arány növelése érdekében. Nehéz megmondani, hogyan fog teljesíteni a munkahelyen, mert... Ma már csak egy adott sablon szerint működik, és nem képes intelligens módban tanulni. Az intelligens mód megjelenését a jövőbeli firmware-ben ígérik, nagy valószínűséggel a jövő év elejére.

Térjünk át az építészetre. A Huawei folytatta saját Smart Matrix technológiájának fejlesztését, amely teljes hálós megközelítést valósít meg az alkatrészek összekapcsolásakor. De ha a V5-ben ez csak a vezérlőktől a lemezekhez való hozzáférésre vonatkozott, most már minden vezérlőnek hozzáférése van az összes porthoz mind a háttérben, mind a front-endben.
Huawei Dorado V6: Szecsuáni hőség

Az új mikroszolgáltatási architektúrának köszönhetően ez lehetővé teszi a terheléselosztást az összes vezérlő között, még akkor is, ha csak egy lun van. Ennek a tömbsornak az operációs rendszerét az alapoktól kezdve fejlesztették ki, és nem egyszerűen a Flash meghajtók használatára optimalizálták. Tekintettel arra, hogy minden vezérlőnk ugyanazokhoz a portokhoz fér hozzá, a vezérlő meghibásodása vagy újraindítása esetén a gazdagép egyetlen utat sem veszít el a tárolórendszer felé, az útvonalváltás a tárolórendszer szintjén történik. Az UltraPath használata azonban nem feltétlenül szükséges a gazdagépen. Egy másik „megtakarítás” a rendszer telepítésekor a szükséges hivatkozások kisebb száma. És ha a „klasszikus” megközelítésnél 4 vezérlőnél 8 linkre lesz szükségünk 2 gyárból, akkor a Huawei esetében akár 2 is elég lesz (most nem egy link áteresztőképességéről beszélek).
Huawei Dorado V6: Szecsuáni hőség

Az előző verzióhoz hasonlóan globális gyorsítótárat használunk tükrözéssel. Ez lehetővé teszi akár két vezérlő egyidejű elvesztését vagy három vezérlő egymás utáni elvesztését anélkül, hogy ez befolyásolná a rendelkezésre állást. De érdemes megjegyezni, hogy nem láttunk teljes terheléselosztást a maradék 3 vezérlő között egy meghibásodás esetén a bemutató standon. A meghibásodott vezérlő terhét teljes egészében a megmaradt vezérlők egyike vette át. Lehetséges, hogy ehhez hosszabb ideig kell hagyni a rendszert ebben a konfigurációban. Mindenesetre ezt a saját tesztjeim segítségével részletesebben ellenőrizni fogom.
A Huawei az új rendszereket end-to-end NVMe rendszerekként pozicionálja, de ma az NVMeOF még nem támogatott az előlapon, csak az FC, az iSCSI vagy az NFS. Ennek végén vagy a következő elején, más funkciókhoz hasonlóan, RoCE támogatást ígérünk.
Huawei Dorado V6: Szecsuáni hőség

A polcok a RoCE segítségével csatlakoznak a vezérlőkhöz is, és ehhez van egy hátránya - a polcok „visszacsatolási” kapcsolatának hiánya, mint az SAS esetében. Véleményem szerint ez még mindig elég nagy hátrány, ha egy meglehetősen nagy rendszert tervez. A helyzet az, hogy az összes polc sorba van kötve, és az egyik polc meghibásodása az összes többi azt követő teljes elérhetetlenségét eredményezi. Ebben az esetben a hibatűrés érdekében az összes polcot a vezérlőhöz kell csatlakoztatnunk, ami a rendszerben a szükséges háttérportok számának növekedését vonja maga után.

És még egy dolog, amit érdemes megemlíteni, a non-disruptive update (NDU). Ahogy fentebb említettem, a Huawei konténeres megközelítést vezetett be az új Dorado vonal operációs rendszerének működtetésére, amely lehetővé teszi a szolgáltatások frissítését és újraindítását anélkül, hogy a vezérlőt teljesen újra kellene indítani. Rögtön érdemes megemlíteni, hogy egyes frissítések kernelfrissítéseket tartalmaznak, és ebben az esetben a vezérlők klasszikus újraindítására néha még szükség lesz a frissítés során, de nem mindig. Ez csökkenti ennek a műveletnek a termelő rendszerre gyakorolt ​​hatását.

Arzenálunkban a tömbök túlnyomó többsége a NetApp-ból származik. Ezért szerintem teljesen logikus lesz, ha egy kis összehasonlítást végzek olyan rendszerekkel, amelyekkel elég sokat kell dolgoznom. Ez nem egy kísérlet annak meghatározására, hogy ki a jobb és ki a rosszabb, vagy kinek az építészete előnyösebb. Megpróbálom józanul és fanatizmus nélkül összehasonlítani ugyanazon probléma megoldásának két különböző megközelítését a különböző gyártóktól. Igen, természetesen ebben az esetben a Huawei rendszereket „elméletben” fogjuk figyelembe venni, és külön is megjegyzem azokat a pontokat, amelyeket a jövőbeni firmware-verziókban tervezünk megvalósítani. Milyen előnyöket látok jelenleg:

  1. A támogatott NVMe meghajtók száma. A NetAppnál jelenleg 288 darab van, míg a Huaweinél típustól függően 1600-6400. Ugyanakkor a Huawei maximális használható kapacitása 32 PBe, akárcsak a NetApp rendszereké (pontosabban 31.64 PBe). És ez annak ellenére, hogy az azonos térfogatú meghajtók támogatottak (15 Tb-ig). A Huawei a következőképpen magyarázza ezt a tényt: nem volt lehetőségük nagyobb állvány összeállítására. Elméletileg nincs mennyiségi korlátozásuk, de egyszerűen még nem tudták tesztelni ezt a tényt. De itt érdemes megjegyezni, hogy a pendrive-ok képességei manapság nagyon magasak, és az NVMe rendszerek esetében azzal kell szembesülnünk, hogy 24 meghajtó elegendő egy csúcskategóriás 2 vezérlős rendszer kihasználásához. Ennek megfelelően a rendszerben lévő lemezek számának további növelése nemhogy teljesítménynövekedést nem eredményez, hanem az IOPS/Tb arányra is rossz hatással lesz. Persze érdemes megnézni, hogy a 4-es és 8000-es 16000 vezérlős rendszerek hány meghajtót bírnak, mert... A Kunpeng 920 képességei és lehetőségei még mindig nem teljesen tisztázottak.
  2. Lun jelenléte a NetApp rendszerek tulajdonosaként. Azok. Csak az egyik vezérlő tud műveleteket végrehajtani a Holddal, míg a második csak az IO-t engedi át magán. Ezzel szemben a Huawei rendszereknek nincsenek tulajdonosai, és az adatblokkokkal végzett műveleteket (tömörítés, deduplikáció) bármelyik vezérlő elvégezheti, illetve lemezekre írhatja.
  3. Egyetlen port sem esik le, ha valamelyik vezérlő meghibásodik. Egyesek számára ez a pillanat rendkívül kritikusnak tűnik. A lényeg az, hogy a tárolórendszeren belüli váltásnak gyorsabbnak kell lennie, mint a gazdagép oldalon. És ha ugyanazon NetApp esetében a gyakorlatban a vezérlő kihúzásakor és az útvonalváltáskor körülbelül 5 másodperces lefagyást tapasztaltunk, akkor a Huawei-re váltással még gyakorolnunk kell.
  4. Frissítéskor nem kell újraindítani a vezérlőt. Ez különösen a NetApps új verzióinak és firmware-ágainak meglehetősen gyakori megjelenése miatt kezdett aggódni. Igen, a Huawei egyes frissítései továbbra is újraindítást igényelnek, de nem mindegyiket.
  5. 4 db Huawei kontroller két NetApp kontroller áráért. Ahogy fentebb is mondtam, a Huawei árpolitikájának köszönhetően csúcskategóriás modelljeivel felveheti a versenyt a középkategóriával.
  6. További chipek jelenléte a polcvezérlőkben és portkártyákban, amelyek potenciálisan a rendszer hatékonyságának javítását szolgálják.

Hátrányok és aggályok általában:

  1. A polcok közvetlen csatlakoztatása a vezérlőkhöz vagy nagyszámú háttérport szükségessége az összes polc vezérlőhöz való csatlakoztatásához.
  2. ARM architektúra és nagyszámú chip jelenléte - milyen hatékonyan fog működni, és elegendő lesz-e a teljesítmény?

A legtöbb aggály és félelem eloszlatható az új vonal személyes tesztelésével. Remélem, hogy a megjelenés után hamarosan megjelennek Moszkvában, és lesz belőlük elég gyorsan beszerezni egyet saját tesztekre. Egyelőre elmondhatjuk, hogy a cég megközelítése összességében érdekesnek tűnik, és az új vonal nagyon jól néz ki a versenytársakhoz képest. A végső megvalósítás sok kérdést vet fel, mert Sok mindent csak az év végén fogunk látni, és talán csak 2020-ban.

Forrás: will.com

Hozzászólás