Huawei Dorado V6: Sečuanska vročina

Huawei Dorado V6: Sečuanska vročina
Letošnje poletje v Moskvi, če sem iskren, ni bilo ravno dobro. Začelo se je prezgodaj in hitro, vsi niso imeli časa, da bi se na to odzvali, končalo pa se je že konec junija. Zato sem, ko me je Huawei povabil na Kitajsko, v mesto Chengdu, kjer je njihov RnD center, po ogledu vremenske napovedi +34 stopinj v senci, takoj privolil. Saj nisem več istih let in moram malo ogreti kosti. Vendar bi rad omenil, da je bilo mogoče ogreti ne le kosti, ampak tudi notranjost, saj je provinca Sichuan, v kateri se pravzaprav nahaja Chengdu, znana po svoji ljubezni do začinjene hrane. A vseeno to ni blog o potovanjih, zato se vrnimo k glavnemu cilju našega potovanja - novi liniji sistemov za shranjevanje - Huawei Dorado V6. Ta članek vas bo malce pomahal iz preteklosti, saj... napisano je bilo pred uradno objavo, objavljeno pa šele po objavi. In tako si bomo danes pobliže ogledali vse zanimivo in okusno, kar nam je pripravil Huawei.

Huawei Dorado V6: Sečuanska vročina
V novi liniji bo 5 modelov. Vsi modeli razen 3000V6 so na voljo v dveh različicah - SAS in NVMe. Izbira določa vmesnik diskov, ki jih lahko uporabljate v tem sistemu, zaledna vrata in število diskovnih pogonov, ki jih lahko namestite v sistem. Za NVMe se uporabljajo SSD diski velikosti Palm, ki so tanjši od klasičnih 2.5" SAS SSD diskov in jih je možno namestiti do 36 kosov. Nova linija je All Flash in ni konfiguracij z diski.

Huawei Dorado V6: Sečuanska vročina
Palm NVMe SSD

Po mojem mnenju sta najbolj zanimiva modela Dorado 8000 in 18000. Huawei ju pozicionira kot vrhunske sisteme in zahvaljujoč Huaweijevi cenovni politiki te modele srednjega razreda nasprotuje segmentu konkurence. Prav na te modele se bom osredotočil v današnjem pregledu. Takoj bom omenil, da imajo junior sistemi z dvojnim krmilnikom zaradi svojih konstrukcijskih značilnosti nekoliko drugačno arhitekturo, ki se razlikuje od Dorado 8000 in 18000, tako da ni vse, o čemer bom govoril danes, uporabno za mlajše modele.

Ena glavnih značilnosti novih sistemov je bila uporaba več čipov, razvitih v podjetju, od katerih vsak omogoča porazdelitev logične obremenitve iz centralnega procesorja krmilnika in dodajanje funkcionalnosti različnim komponentam.
Huawei Dorado V6: Sečuanska vročina

Srce novih sistemov so procesorji Kunpeng 920, razviti na tehnologijah ARM, ki jih proizvaja Huawei neodvisno. Odvisno od modela se število jeder, njihova frekvenca in število nameščenih procesorjev v posameznem krmilniku razlikujejo:
Huawei Dorado V6 8000 – 2 CPU, 64 jeder
Huawei Dorado V6 18000 – 4 CPU, 48 jeder
Huawei Dorado V6: Sečuanska vročina

Huawei je ta procesor razvil na arhitekturi ARM in kolikor mi je znano, ga je sprva nameraval vgraditi le v starejše modele Dorado 8000 in 18000, kot je bilo že pri nekaterih modelih V5, vendar so sankcije to idejo prilagodile. Seveda je ARM med uvedbo sankcij govoril tudi o zavrnitvi sodelovanja s Huaweijem, a tukaj je situacija drugačna kot pri Intelu. Huawei te čipe proizvaja neodvisno in nobene sankcije ne morejo ustaviti tega procesa. Prekinitev odnosov z ARM le ogroža izgubo dostopa do novih dogodkov. Kar zadeva zmogljivost, bo mogoče soditi šele po izvedbi neodvisnih testov. Čeprav sem videl, kako je bil 18000M IOPS brez težav odstranjen iz sistema Dorado 1, ne bom verjel, dokler tega ne ponovim lastnoročno v svoji omari. Je pa tam v krmilnikih res veliko moči. Starejši modeli so opremljeni s 4 krmilniki, vsak s 4 procesorji, kar daje skupno 768 jeder.
Huawei Dorado V6: Sečuanska vročina

Toda o jedrih bom govoril še kasneje, ko bomo pogledali arhitekturo novih sistemov, zdaj pa se vrnimo k drugemu čipu, ki je nameščen v sistemu. Čip se zdi izjemno zanimiva rešitev Vzpon 310 (Kolikor razumem, mlajši brat Ascenda 910, ki je bil pred kratkim predstavljen javnosti). Njegova naloga je analizirati podatkovne bloke, ki vstopajo v sistem, da poveča razmerje zadetkov branja. Kako se bo obnesel pri delu, je težko reči, saj ... Danes deluje samo po dani predlogi in nima možnosti učenja v inteligentnem načinu. Pojav inteligentnega načina je obljubljen v prihodnji vdelani programski opremi, najverjetneje v začetku naslednjega leta.

Preidimo k arhitekturi. Huawei je nadaljeval z razvojem lastne tehnologije Smart Matrix, ki izvaja pristop popolne mreže pri povezovanju komponent. Toda če je bilo v V5 to samo za dostop krmilnikov do diskov, imajo zdaj vsi krmilniki dostop do vseh vrat na zadnji in sprednji strani.
Huawei Dorado V6: Sečuanska vročina

Zahvaljujoč novi mikrostoritveni arhitekturi to omogoča tudi uravnoteženje obremenitve med vsemi krmilniki, tudi če obstaja samo en lun. OS za to linijo matrik je bil razvit od začetka in ne le optimiziran za uporabo bliskovnih pogonov. Ker imajo vsi naši krmilniki dostop do istih vrat, v primeru okvare ali ponovnega zagona krmilnika gostitelj ne izgubi niti ene poti do pomnilniškega sistema, preklapljanje poti pa se izvaja na nivoju pomnilniškega sistema. Vendar uporaba UltraPath na gostitelju ni nujno potrebna. Drugi "prihranek" pri namestitvi sistema je manjše število potrebnih povezav. In če bomo pri "klasičnem" pristopu za 4 krmilnike potrebovali 8 povezav iz 2 tovarn, bosta v primeru Huaweia dovolj celo 2 (ne govorim zdaj o zadostnosti prepustnosti ene povezave).
Huawei Dorado V6: Sečuanska vročina

Kot v prejšnji različici se uporablja globalni predpomnilnik z zrcaljenjem. To vam omogoča, da izgubite do dva krmilnika hkrati ali tri krmilnike zaporedno, ne da bi to vplivalo na razpoložljivost. Vendar je vredno omeniti, da nismo videli popolne uravnoteženosti obremenitve med preostalimi 3 krmilniki v primeru ene okvare na demo stojalu. Obremenitev okvarjenega krmilnika je v celoti prevzel eden od preostalih. Možno je, da je za to potrebno pustiti, da sistem v tej konfiguraciji deluje dlje. V vsakem primeru bom to podrobneje preveril z lastnimi testi.
Huawei postavlja nove sisteme kot sisteme NVMe od konca do konca, vendar danes NVMeOF še ni podprt na sprednji strani, le FC, iSCSI ali NFS. Ob koncu tega ali na začetku naslednjega se nam, tako kot drugim funkcijam, obeta podpora RoCE.
Huawei Dorado V6: Sečuanska vročina

Police so povezane tudi s krmilniki z uporabo RoCE, s tem pa je povezana ena pomanjkljivost - odsotnost "loopback" povezave polic, kot je bilo v primeru SAS. Po mojem mnenju je to še vedno precej velika pomanjkljivost, če načrtujete precej velik sistem. Dejstvo je, da so vse police povezane zaporedno, okvara ene od polic pa povzroči popolno nedostopnost vseh ostalih, ki ji sledijo. V tem primeru bomo morali za zagotovitev tolerance na napake povezati vse police s krmilniki, kar pomeni povečanje potrebnega števila backend portov v sistemu.

In še ena stvar, ki jo je vredno omeniti, je posodobitev brez motenj (NDU). Kot sem rekel zgoraj, je Huawei za novo linijo Dorado implementiral vsebniški pristop k delovanju operacijskega sistema, kar vam omogoča posodobitev in ponovni zagon storitev, ne da bi morali popolnoma znova zagnati krmilnik. Takoj je treba omeniti, da bodo nekatere posodobitve vsebovale posodobitve jedra in v tem primeru bo med posodobitvijo včasih še vedno potreben klasičen ponovni zagon krmilnikov, vendar ne vedno. To bo zmanjšalo vpliv te operacije na proizvodni sistem.

V našem arzenalu je velika večina matrik iz NetApp-a. Zato se mi zdi povsem logično, če naredim majhno primerjavo s sistemi, s katerimi moram precej delati. To ni poskus ugotavljanja, kdo je boljši in kdo slabši ali čigava arhitektura je ugodnejša. Poskušal bom trezno in brez fanatizma primerjati dva različna pristopa k reševanju istega problema različnih prodajalcev. Da, seveda, v tem primeru bomo sisteme Huawei obravnavali v "teoriji", ločeno pa bom omenil tudi tiste točke, ki naj bi bile implementirane v prihodnjih različicah vdelane programske opreme. Kakšne prednosti vidim v tem trenutku:

  1. Število podprtih pogonov NVMe. NetApp jih ima trenutno 288, Huawei pa 1600-6400, odvisno od modela. Hkrati je Huaweijeva največja uporabna zmogljivost 32PBe, tako kot sistemi NetApp (če smo natančnejši, imajo 31.64PBe). In to kljub dejstvu, da so podprti diski enake prostornine (do 15 Tb). Huawei to dejstvo pojasnjuje takole: niso imeli možnosti sestaviti večjega stojala. Teoretično nimajo omejitve količine, vendar tega dejstva preprosto še niso mogli preizkusiti. Toda tukaj je treba omeniti, da so zmogljivosti bliskovnih pogonov danes zelo visoke, v primeru sistemov NVMe pa se soočamo z dejstvom, da je 24 pogonov dovolj za uporabo vrhunskega sistema z 2 krmilnikoma. Skladno s tem nadaljnje povečanje števila diskov v sistemu ne bo samo zagotovilo povečanja zmogljivosti, ampak bo tudi slabo vplivalo na razmerje IOPS/Tb. Seveda je vredno videti, koliko pogonov zmoreta sistema s 4 krmilniki 8000 in 16000, ker ... Zmogljivosti in potencial Kunpenga 920 še vedno niso popolnoma jasni.
  2. Prisotnost Luna kot lastnika sistemov NetApp. Tisti. Samo en krmilnik lahko izvaja operacije z luno, medtem ko drugi prepušča samo IO skozi sebe. Sistemi Huawei, nasprotno, nimajo nobenih lastnikov in operacije s podatkovnimi bloki (stiskanje, deduplikacija) lahko izvaja kateri koli od krmilnikov, prav tako pa jih lahko zapisuje na diske.
  3. Nobena vrata ne izginejo, ko eden od krmilnikov odpove. Za nekatere se ta trenutek zdi izjemno kritičen. Bistvo je, da bi moralo preklapljanje znotraj sistema za shranjevanje potekati hitreje kot na strani gostitelja. In če smo v primeru istega NetAppa v praksi ugotovili zamrznitev približno 5 sekund, ko smo izvlekli krmilnik in preklopili poti, potem moramo s prehodom na Huawei še vedno vaditi.
  4. Pri posodabljanju krmilnika ni treba znova zagnati. To me je še posebej začelo skrbeti ob dokaj pogostih izdajah novih različic in vej programske opreme za NetApps. Da, nekatere posodobitve za Huawei bodo še vedno zahtevale ponovni zagon, vendar ne vse.
  5. 4 krmilniki Huawei za ceno dveh krmilnikov NetApp. Kot sem že omenil, lahko zaradi Huaweijeve cenovne politike s svojimi modeli višjega razreda konkurira modelom srednjega razreda.
  6. Prisotnost dodatnih čipov v krmilnikih polic in vratnih karticah, ki so potencialno namenjeni izboljšanju učinkovitosti sistema.

Slabosti in pomisleki na splošno:

  1. Neposredna povezava polic s krmilniki ali potreba po velikem številu zalednih vrat za povezavo vseh polic s krmilniki.
  2. Arhitektura ARM in prisotnost velikega števila čipov - kako učinkovito bo delovalo in ali bo zmogljivost zadostna?

Večino pomislekov in strahov lahko razblini osebno testiranje nove linije. Upam, da se bodo kmalu po izidu pojavili v Moskvi in ​​​​jih bo dovolj, da jih boste hitro dobili za svoje teste. Zaenkrat lahko rečemo, da je na splošno pristop podjetja videti zanimiv, nova linija pa je videti zelo dobra v primerjavi s svojimi konkurenti. Končna izvedba poraja veliko vprašanj, saj Marsikaj bomo videli šele konec leta, morda pa šele leta 2020.

Vir: www.habr.com

Dodaj komentar