Huawei Dorado V6: Sečuanska vrućina

Huawei Dorado V6: Sečuanska vrućina
Leto u Moskvi ove godine, da budem iskren, nije bilo baš dobro. Počelo je prerano i brzo, nisu svi imali vremena da reaguju na to, a završilo se već krajem juna. Stoga, kada me je Huawei pozvao da odem u Kinu, u grad Chengdu, gdje se nalazi njihov RnD centar, nakon što sam pogledao vremensku prognozu od +34 stepena u hladu, odmah sam pristao. Na kraju krajeva, nisam više istih godina i moram malo da zagrijem kosti. Ali želim napomenuti da je bilo moguće zagrijati ne samo kosti, već i unutrašnjost, jer je pokrajina Sečuan, u kojoj se zapravo Chengdu nalazi, poznata po svojoj ljubavi prema začinjenoj hrani. Ali ipak, ovo nije blog o putovanjima, pa se vratimo na glavni cilj našeg putovanja - novu liniju sistema za pohranu - Huawei Dorado V6. Ovaj članak će vas malo osvrnuti na prošlost, jer... napisana je prije službene objave, ali objavljena tek nakon objavljivanja. I tako, danas ćemo pobliže pogledati sve zanimljivo i ukusno što je Huawei pripremio za nas.

Huawei Dorado V6: Sečuanska vrućina
U novoj liniji će biti 5 modela. Svi modeli osim 3000V6 mogu biti dostupni u dvije verzije - SAS i NVMe. Izbor određuje interfejs diskova koje možete koristiti u ovom sistemu, Back-End portove i broj disk jedinica koje možete instalirati u sistem. Za NVMe se koriste SSD-ovi veličine dlana, koji su tanji od klasičnih 2.5" SAS SSD-ova i mogu se instalirati u do 36 komada. Nova linija je All Flash i nema konfiguracija sa diskovima.

Huawei Dorado V6: Sečuanska vrućina
Palm NVMe SSD

Po mom mišljenju, najzanimljiviji modeli izgledaju Dorado 8000 i 18000. Huawei ih pozicionira kao High-end sisteme, a zahvaljujući Huaweijevoj cjenovnoj politici suprotstavlja ove modele srednjeg ranga u odnosu na konkurentski segment. Upravo na ove modele ću se fokusirati u svojoj današnjoj recenziji. Odmah ću napomenuti da zbog svojih dizajnerskih karakteristika, juniorski dual-controller sistemi imaju malo drugačiju arhitekturu, različitu od Dorado 8000 i 18000, tako da nije sve o čemu ću danas govoriti primjenjivo na mlađe modele.

Jedna od glavnih karakteristika novih sistema bila je upotreba nekoliko čipova, razvijenih u kompaniji, od kojih svaki omogućava distribuciju logičkog opterećenja sa centralnog procesora kontrolera i dodavanje funkcionalnosti različitim komponentama.
Huawei Dorado V6: Sečuanska vrućina

Srce novih sistema su Kunpeng 920 procesori, razvijeni na ARM tehnologijama i proizvedeni od strane Huawei nezavisno. U zavisnosti od modela, broj jezgara, njihova frekvencija i broj instaliranih procesora u svakom kontroleru varira:
Huawei Dorado V6 8000 – 2CPU, 64 jezgra
Huawei Dorado V6 18000 – 4CPU, 48 jezgra
Huawei Dorado V6: Sečuanska vrućina

Huawei je ovaj procesor razvio na ARM arhitekturi, a koliko je meni poznato, prvobitno je planirao da ga ugradi samo u starije modele Dorado 8000 i 18000, kao što je već bio slučaj sa nekim V5 modelima, ali su sankcije izvršile prilagođavanje ovoj ideji. Naravno, ARM je takođe govorio o odbijanju saradnje sa Huaweijem tokom uvođenja sankcija, ali je ovde situacija drugačija nego sa Intelom. Huawei samostalno proizvodi ove čipove i nikakve sankcije ne mogu zaustaviti ovaj proces. Prekid odnosa sa ARM-om samo preti gubitkom pristupa novim dešavanjima. Što se tiče performansi, moći će se suditi tek nakon provođenja nezavisnih testova. Iako sam vidio kako je 18000M IOPS bez problema uklonjen iz sistema Dorado 1, dok to ne ponovim vlastitim rukama u rek-u, neću vjerovati. Ali zaista ima puno snage u kontrolerima. Stariji modeli su opremljeni sa 4 kontrolera, svaki sa 4 procesora, dajući ukupno 768 jezgara.
Huawei Dorado V6: Sečuanska vrućina

Ali o jezgrima ću govoriti još kasnije, kada pogledamo arhitekturu novih sistema, ali za sada se vratimo na još jedan čip instaliran u sistemu. Čip izgleda kao izuzetno zanimljivo rješenje Uspon 310 (Koliko sam shvatio, mlađi brat Ascenda 910, koji je nedavno predstavljen javnosti). Njegov zadatak je analizirati blokove podataka koji ulaze u sistem kako bi se povećao omjer čitanja. Teško je reći kako će se ponašati na poslu, jer... Danas radi samo prema datom šablonu i nema mogućnost učenja u inteligentnom načinu rada. Pojava inteligentnog načina rada obećava se u budućem firmveru, najvjerovatnije početkom sljedeće godine.

Pređimo na arhitekturu. Huawei je nastavio da razvija sopstvenu Smart Matrix tehnologiju, koja implementira potpuni mrežni pristup povezivanju komponenti. Ali ako je u V5 ovo bilo samo za pristup s kontrolera na diskove, sada svi kontroleri imaju pristup svim portovima i na Back-End-u i na Front-End-u.
Huawei Dorado V6: Sečuanska vrućina

Zahvaljujući novoj mikroservisnoj arhitekturi, ovo također omogućava balansiranje opterećenja između svih kontrolera, čak i ako postoji samo jedan lun. OS za ovu liniju nizova je razvijen od temelja, a ne samo optimiziran za korištenje Flash diskova. Zbog činjenice da svi naši kontroleri imaju pristup istim portovima, u slučaju kvara kontrolera ili ponovnog pokretanja, host ne gubi ni jednu putanju do sistema za skladištenje podataka, a prebacivanje putanje se vrši na nivou sistema za skladištenje podataka. Međutim, korištenje UltraPath-a na hostu nije striktno neophodno. Još jedna “ušteda” prilikom instaliranja sistema je manji broj potrebnih linkova. A ako će nam uz „klasični“ pristup za 4 kontrolera trebati 8 veza iz 2 tvornice, onda će u slučaju Huaweija čak i 2 biti dovoljne (ne govorim sada o dovoljnosti propusnosti jedne veze).
Huawei Dorado V6: Sečuanska vrućina

Kao iu prethodnoj verziji, koristi se globalna keš memorija sa zrcaljenjem. Ovo vam omogućava da izgubite do dva kontrolera istovremeno ili tri kontrolera uzastopno bez uticaja na dostupnost. Ali vrijedi napomenuti da nismo vidjeli potpunu ravnotežu opterećenja između preostala 3 kontrolera u slučaju jednog kvara na demo štandu. Opterećenje pokvarenog regulatora u potpunosti je preuzeo jedan od preostalih. Moguće je da je za to potrebno pustiti sistem da radi duže u ovoj konfiguraciji. U svakom slučaju, to ću detaljnije provjeriti vlastitim testovima.
Huawei pozicionira nove sisteme kao end-to-end NVMe sisteme, ali danas NVMeOF još nije podržan na prednjem kraju, već samo FC, iSCSI ili NFS. Na kraju ove ili na početku sljedećeg, kao i drugih funkcija, obećana nam je RoCE podrška.
Huawei Dorado V6: Sečuanska vrućina

Police su također povezane s kontrolerima koristeći RoCE, a s tim je povezan i jedan nedostatak - nepostojanje “loopback” veze polica, kao što je bio slučaj sa SAS-om. Po mom mišljenju, ovo je još uvijek prilično veliki nedostatak ako planirate prilično veliki sistem. Činjenica je da su sve police povezane u nizu, a kvar jedne police dovodi do potpunog nepristupačnosti svih ostalih koji slijede. U ovom slučaju, da bismo osigurali toleranciju grešaka, morat ćemo sve police povezati na kontrolere, što podrazumijeva povećanje potrebnog broja backend portova u sistemu.

Još jedna stvar koju vrijedi spomenuti je ažuriranje bez prekida (NDU). Kao što sam već rekao, Huawei je implementirao kontejnerski pristup u radu OS-a za novu liniju Dorado, što vam omogućava da ažurirate i ponovo pokrenete usluge bez potrebe za potpunim ponovnim pokretanjem kontrolera. Ovdje vrijedi odmah napomenuti da će neka ažuriranja sadržavati ažuriranja kernela, au ovom slučaju će ponekad i dalje biti potrebno klasično ponovno pokretanje kontrolera tokom ažuriranja, ali ne uvijek. Ovo će smanjiti uticaj ove operacije na produktivni sistem.

U našem arsenalu, velika većina nizova je iz NetApp-a. Stoga, mislim da će biti sasvim logično ako napravim malo poređenje sa sistemima sa kojima moram dosta raditi. Ovo nije pokušaj da se utvrdi ko je bolji, a ko gori ili čija je arhitektura povoljnija. Pokušat ću trezveno i bez fanatizma uporediti dva različita pristupa rješavanju istog problema različitih dobavljača. Da, naravno, u ovom slučaju ćemo razmotriti Huawei sisteme u "teoriji", a posebno ću napomenuti i one tačke koje se planiraju implementirati u budućim verzijama firmvera. Koje prednosti trenutno vidim:

  1. Broj podržanih NVMe diskova. NetApp ih trenutno ima 288, dok Huawei ima 1600-6400, ovisno o modelu. Istovremeno, Huaweijev Max iskoristivi kapacitet je 32 PBe, baš kao i NetApp sistemi (tačnije, imaju 31.64 PBe). I to uprkos činjenici da su podržani diskovi istog volumena (do 15Tb). Huawei ovu činjenicu objašnjava na sljedeći način: nisu imali priliku sastaviti veći štand. U teoriji, nemaju ograničenje količine, ali jednostavno još nisu bili u mogućnosti testirati ovu činjenicu. Ali ovdje je vrijedno napomenuti da su mogućnosti fleš diskova danas vrlo visoke, a u slučaju NVMe sistema suočeni smo sa činjenicom da su 24 drajva dovoljna za korištenje vrhunskog sistema sa 2 kontrolera. Shodno tome, dalje povećanje broja diskova u sistemu ne samo da neće obezbediti povećanje performansi, već će imati i loš uticaj na odnos IOPS/Tb. Naravno, vredi videti koliko pogona mogu da podnesu sistemi sa 4 kontrolera 8000 i 16000, jer... Mogućnosti i potencijal Kunpenga 920 još uvijek nisu potpuno jasni.
  2. Prisustvo Luna kao vlasnika NetApp sistema. One. Samo jedan kontroler može obavljati operacije sa mjesecom, dok drugi samo propušta IO kroz sebe. Huawei sistemi, naprotiv, nemaju vlasnika i operacije sa blokovima podataka (kompresija, deduplikacija) može da obavlja bilo koji od kontrolera, kao i da ih upisuje na diskove.
  3. Nijedan port ne pada kada jedan od kontrolera pokvari. Za neke ovaj trenutak izgleda izuzetno kritičan. Suština je da bi se prebacivanje unutar sistema za skladištenje trebalo dogoditi brže nego na strani domaćina. I ako smo u slučaju istog NetApp-a u praksi zatekli zamrzavanje od oko 5 sekundi pri izvlačenju kontrolera i prebacivanju staza, onda s prelaskom na Huawei još moramo vježbati.
  4. Nema potrebe za ponovnim pokretanjem kontrolera prilikom ažuriranja. To me je posebno počelo zabrinjavati zbog prilično čestih izdavanja novih verzija i grana firmvera za NetApps. Da, neka ažuriranja za Huawei će i dalje zahtijevati ponovno pokretanje, ali ne sva.
  5. 4 Huawei kontrolera po cijeni od dva NetApp kontrolera. Kao što sam već rekao, zahvaljujući Huaweijevoj politici cijena, može se takmičiti sa srednjim rangom sa svojim high-end modelima.
  6. Prisutnost dodatnih čipova u kontrolerima polica i port karticama, koji su potencijalno namijenjeni poboljšanju efikasnosti sistema.

Nedostaci i nedostaci općenito:

  1. Direktno povezivanje polica na kontrolere ili potreba za velikim brojem back-end portova za povezivanje svih polica na kontrolere.
  2. ARM arhitektura i prisustvo velikog broja čipova - koliko će efikasno raditi i da li će performanse biti dovoljne?

Većina zabrinutosti i strahova može se otkloniti ličnim testiranjem nove linije. Nadam se da će se ubrzo nakon izlaska pojaviti u Moskvi i da će ih biti dovoljno da brzo nabavite jedan za vlastite testove. Za sada možemo reći da generalno pristup kompanije izgleda zanimljivo, a nova linija izgleda veoma dobro u poređenju sa svojim konkurentima. Konačna implementacija postavlja mnoga pitanja, jer Mnogo toga ćemo vidjeti tek krajem godine, a možda tek 2020.

izvor: www.habr.com

Dodajte komentar