Huawei Dorado V6: Sečuanska vrućina

Huawei Dorado V6: Sečuanska vrućina
Ljeto u Moskvi ove godine, da budem iskren, nije bilo baš dobro. Počelo je prerano i brzo, nisu svi stigli reagirati, a završilo je već krajem lipnja. Stoga, kada me Huawei pozvao da odemo u Kinu, u grad Chengdu, gdje se nalazi njihov RnD centar, nakon što sam pogledao vremensku prognozu od +34 stupnja u hladu, odmah sam pristao. Uostalom, nisam više u godinama i moram malo zagrijati kosti. No, želio bih napomenuti da je bilo moguće zagrijati ne samo kosti, već i iznutra, jer je pokrajina Sichuan, u kojoj se zapravo nalazi Chengdu, poznata po svojoj ljubavi prema začinjenoj hrani. No ipak, ovo nije blog o putovanjima, pa se vratimo na glavni cilj našeg putovanja - novu liniju sustava za pohranu - Huawei Dorado V6. Ovaj članak će vas malo trgnuti iz prošlosti, jer... napisana je prije službene objave, ali objavljena tek nakon objave. I tako, danas ćemo pobliže pogledati sve zanimljivo i ukusno što nam je Huawei pripremio.

Huawei Dorado V6: Sečuanska vrućina
U novoj liniji bit će 5 modela. Svi modeli osim 3000V6 mogu se dobiti u dvije verzije - SAS i NVMe. Izbor određuje sučelje diskova koje možete koristiti u ovom sustavu, Back-End portove i broj diskova koje možete instalirati u sustav. Za NVMe se koriste Palm-sized SSD-ovi koji su tanji od klasičnih 2.5" SAS SSD-ova i mogu se ugraditi u do 36 komada. Nova linija je All Flash i nema konfiguracija s diskovima.

Huawei Dorado V6: Sečuanska vrućina
Palm NVMe SSD

Po mom mišljenju, Dorado 8000 i 18000 izgledaju kao najzanimljiviji modeli.Huawei ih pozicionira kao High-end sustave, a zahvaljujući Huaweiovoj cjenovnoj politici, ove modele srednje klase suprotstavlja segmentu konkurencije. Upravo na te modele ću se fokusirati u svojoj današnjoj recenziji. Odmah ću napomenuti da zbog svojih dizajnerskih značajki, juniorski sustavi s dva kontrolera imaju nešto drugačiju arhitekturu, različitu od Dorada 8000 i 18000, tako da nije sve o čemu ću danas govoriti primjenjivo na juniorske modele.

Jedna od glavnih značajki novih sustava bila je upotreba nekoliko čipova, razvijenih u tvrtki, od kojih svaki omogućuje distribuciju logičkog opterećenja središnjeg procesora kontrolera i dodavanje funkcionalnosti različitim komponentama.
Huawei Dorado V6: Sečuanska vrućina

Srce novih sustava su procesori Kunpeng 920, razvijeni na ARM tehnologijama koje Huawei samostalno proizvodi. Ovisno o modelu, broj jezgri, njihova frekvencija i broj instaliranih procesora u svakom kontroleru variraju:
Huawei Dorado V6 8000 – 2 CPU, 64 jezgre
Huawei Dorado V6 18000 – 4 CPU, 48 jezgre
Huawei Dorado V6: Sečuanska vrućina

Huawei je ovaj procesor razvio na ARM arhitekturi, i koliko ja znam, u početku ga je planirao instalirati samo u starije modele Dorado 8000 i 18000, kao što je već bio slučaj s nekim V5 modelima, ali sankcije su prilagodile ovu ideju. Naravno, i ARM je govorio o odbijanju suradnje s Huaweijem prilikom uvođenja sankcija, no ovdje je situacija drugačija nego s Intelom. Huawei te čipove proizvodi samostalno i nikakve sankcije ne mogu zaustaviti taj proces. Prekidanje odnosa s ARM-om samo prijeti gubitkom pristupa novim razvojima. Što se tiče performansi, bit će moguće suditi tek nakon provođenja neovisnih testova. Iako sam vidio kako je 18000M IOPS skinuto sa sustava Dorado 1 bez problema, dok to ne ponovim vlastitim rukama u svom racku, neću vjerovati. Ali u kontrolerima je stvarno puno snage. Stariji modeli opremljeni su s 4 kontrolera, svaki s 4 procesora, što daje ukupno 768 jezgri.
Huawei Dorado V6: Sečuanska vrućina

Ali o jezgrama ću govoriti kasnije, kada pogledamo arhitekturu novih sustava, ali za sada se vratimo na drugi čip instaliran u sustavu. Čip izgleda kao izuzetno zanimljivo rješenje Uspon 310 (Koliko sam shvatio, mlađi brat Ascenda 910 koji je nedavno predstavljen javnosti). Njegov zadatak je analizirati blokove podataka koji ulaze u sustav kako bi se povećao omjer pogodaka čitanja. Teško je reći kako će se pokazati na poslu, jer... Danas radi samo prema zadanom predlošku i nema mogućnost učenja u inteligentnom načinu rada. Pojava inteligentnog načina rada obećana je u budućem firmware-u, najvjerojatnije početkom sljedeće godine.

Prijeđimo na arhitekturu. Huawei je nastavio razvijati vlastitu tehnologiju Smart Matrix, koja implementira potpuni mrežni pristup povezivanju komponenti. Ali ako je u V5 ovo bilo samo za pristup s kontrolera na diskove, sada svi kontroleri imaju pristup svim priključcima na Back-Endu i Front-Endu.
Huawei Dorado V6: Sečuanska vrućina

Zahvaljujući novoj mikroservisnoj arhitekturi, to također omogućuje balansiranje opterećenja između svih kontrolera, čak i ako postoji samo jedan lun. OS za ovu liniju polja razvijen je od temelja, a ne samo optimiziran za korištenje Flash pogona. Zbog činjenice da svi naši kontroleri imaju pristup istim portovima, u slučaju kvara kontrolera ili ponovnog pokretanja, host ne gubi niti jednu stazu do sustava za pohranu, a prebacivanje putanje se provodi na razini sustava za pohranu. Međutim, korištenje UltraPath-a na glavnom računalu nije nužno potrebno. Još jedna “ušteda” kod instalacije sustava je manji broj potrebnih poveznica. A ako će nam s "klasičnim" pristupom za 4 kontrolera trebati 8 veza iz 2 tvornice, onda će u slučaju Huaweia biti dovoljna čak 2 (ne govorim sada o dostatnosti propusnosti jedne veze).
Huawei Dorado V6: Sečuanska vrućina

Kao iu prethodnoj verziji, koristi se globalna predmemorija sa zrcaljenjem. To vam omogućuje da izgubite do dva kontrolera istovremeno ili tri kontrolera uzastopno bez utjecaja na dostupnost. Ali vrijedi napomenuti da nismo vidjeli potpuno balansiranje opterećenja između preostala 3 kontrolera u slučaju jednog kvara na demo štandu. Opterećenje pokvarenog kontrolera u potpunosti je preuzeo jedan od preostalih. Moguće je da je za to potrebno pustiti sustav da dulje radi u ovoj konfiguraciji. U svakom slučaju, to ću detaljnije provjeriti vlastitim testovima.
Huawei pozicionira nove sustave kao End-to-End NVMe sustave, ali danas NVMeOF još nije podržan na prednjem dijelu, samo FC, iSCSI ili NFS. Na kraju ovog ili početkom sljedećeg, kao i drugim značajkama, obećana nam je RoCE podrška.
Huawei Dorado V6: Sečuanska vrućina

Police su također povezane s kontrolerima pomoću RoCE-a, a uz to postoji i jedan nedostatak - nepostojanje "loopback" veze polica, kao što je bio slučaj sa SAS-om. Po mom mišljenju, ovo je još uvijek prilično veliki nedostatak ako planirate prilično velik sustav. Činjenica je da su sve police povezane u seriju, a kvar jedne od polica dovodi do potpune nedostupnosti svih ostalih iza nje. U ovom slučaju, da bismo osigurali toleranciju na pogreške, morat ćemo sve police spojiti na kontrolere, što podrazumijeva povećanje potrebnog broja backend portova u sustavu.

I još nešto vrijedno spomena je non-disruptive update (NDU). Kao što sam rekao gore, Huawei je implementirao kontejnerski pristup upravljanju OS-om za novu liniju Dorado, što vam omogućuje ažuriranje i ponovno pokretanje usluga bez potrebe za potpunim ponovnim pokretanjem kontrolera. Odmah je vrijedno spomenuti da će neka ažuriranja sadržavati ažuriranja kernela, au ovom slučaju će ponekad biti potrebno klasično ponovno pokretanje kontrolera tijekom ažuriranja, ali ne uvijek. To će smanjiti utjecaj ove operacije na proizvodni sustav.

U našem arsenalu, velika većina polja je iz NetApp-a. Stoga mislim da će biti sasvim logično ako napravim malu usporedbu sa sustavima s kojima moram dosta raditi. Ovo nije pokušaj utvrđivanja tko je bolji, a tko lošiji ili čija je arhitektura bolja. Pokušat ću trezveno i bez fanatizma usporediti dva različita pristupa rješavanju istog problema od različitih dobavljača. Da, naravno, u ovom slučaju ćemo razmotriti Huawei sustave u "teoriji", a također ću zasebno zabilježiti one točke koje se planiraju implementirati u budućim verzijama firmvera. Koje prednosti vidim u ovom trenutku:

  1. Broj podržanih NVMe diskova. NetApp ih trenutno ima 288, dok Huawei ima 1600-6400, ovisno o modelu. U isto vrijeme, Huaweijev maksimalni iskoristivi kapacitet je 32PBe, baš kao i NetApp sustavi (točnije, imaju 31.64PBe). I to unatoč činjenici da su podržani pogoni istog volumena (do 15 Tb). Huawei tu činjenicu objašnjava na sljedeći način: nisu imali priliku sastaviti veće postolje. U teoriji, oni nemaju ograničenje količine, ali tu činjenicu jednostavno još nisu uspjeli testirati. Ali ovdje je vrijedno napomenuti da su mogućnosti flash pogona danas vrlo visoke, au slučaju NVMe sustava suočavamo se s činjenicom da su 24 pogona dovoljna za korištenje vrhunskog sustava s 2 kontrolera. Sukladno tome, daljnje povećanje broja diskova u sustavu ne samo da neće dati povećanje performansi, već će imati i loš učinak na omjer IOPS/Tb. Naravno, vrijedi vidjeti koliko pogona mogu podnijeti sustavi s 4 kontrolera 8000 i 16000, jer... Mogućnosti i potencijal Kunpenga 920 još uvijek nisu potpuno jasni.
  2. Prisutnost Luna kao vlasnika NetApp sustava. Oni. Samo jedan kontroler može raditi s mjesecom, dok drugi samo propušta IO kroz sebe. Huawei sustavi, naprotiv, nemaju vlasnika i operacije s blokovima podataka (kompresija, deduplikacija) mogu se izvoditi bilo kojim od kontrolera, kao i zapisivati ​​na diskove.
  3. Nijedan priključak ne pada kada jedan od kontrolera zakaže. Za neke ovaj trenutak izgleda izuzetno kritičan. Zaključak je da bi se prebacivanje unutar sustava za pohranu trebalo dogoditi brže nego na strani glavnog računala. A ako smo u slučaju istog NetAppa u praksi pronašli zamrzavanje od oko 5 sekundi prilikom izvlačenja kontrolera i prebacivanja staza, onda s prelaskom na Huawei još uvijek moramo vježbati.
  4. Nema potrebe za ponovnim pokretanjem kontrolera prilikom ažuriranja. To me posebno počelo zabrinjavati s prilično čestim izdavanjem novih verzija i ogranaka firmvera za NetApps. Da, neka će ažuriranja za Huawei i dalje zahtijevati ponovno pokretanje, ali ne sva.
  5. 4 Huawei kontrolera po cijeni dva NetApp kontrolera. Kao što sam već rekao, zahvaljujući Huaweiovoj cjenovnoj politici, može se natjecati s modelima srednje klase svojim modelima visoke klase.
  6. Prisutnost dodatnih čipova u kontrolerima polica i priključnim karticama, koji su potencijalno namijenjeni poboljšanju učinkovitosti sustava.

Nedostaci i problemi općenito:

  1. Izravno povezivanje polica s kontrolerima ili potreba za velikim brojem pozadinskih priključaka za povezivanje svih polica s kontrolerima.
  2. ARM arhitektura i prisutnost velikog broja čipova - koliko će učinkovito raditi i hoće li performanse biti dovoljne?

Većina briga i strahova može se otkloniti osobnim testiranjem nove linije. Nadam se da će se uskoro nakon izlaska pojaviti u Moskvi i da će ih biti dovoljno da brzo nabavite jedan za vlastite testove. Za sada možemo reći da općenito pristup tvrtke izgleda zanimljivo, a nova linija izgleda vrlo dobro u usporedbi s konkurencijom. Konačna implementacija postavlja mnogo pitanja, jer Mnogo toga ćemo vidjeti tek krajem godine, a možda tek 2020.

Izvor: www.habr.com

Dodajte komentar