Huawei Dorado V6: calore di Sichuan

Huawei Dorado V6: calore di Sichuan
L'estiu in Mosca questu annu era, per esse onestu, micca assai bonu. Accuminciau troppu prestu è prestu, micca tutti avianu u tempu di reagisce à questu, è finì digià à a fine di ghjugnu. Per quessa, quandu Huawei m'hà invitatu à andà in Cina, à a cità di Chengdu, induve u so centru RnD hè situatu, dopu avè vistu a previsione di u tempu + 34 gradi in l'ombra, aghju subitu accunsentutu. Dopu tuttu, ùn sò più a listessa età è aghju bisognu di scaldà un pocu l'osse. Ma vogliu nutà chì era pussibule di calà micca solu l'osse, ma ancu l'internu, perchè a pruvincia di Sichuan, in quale Chengdu hè veramente situatu, hè famosa per u so amore di l'alimentu piccante. Ma ancu, questu ùn hè micca un blog di viaghju, allora vultemu à u scopu principale di u nostru viaghju - una nova linea di sistemi di almacenamento - Huawei Dorado V6. Questu articulu vi farà un pocu di u passatu, perchè ... hè statu scrittu prima di l'annunziu ufficiale, ma publicatu solu dopu a liberazione. È cusì, oghje avemu da piglià un ochju più vicinu à tuttu ciò chì hè interessante è gustoso chì Huawei hà preparatu per noi.

Huawei Dorado V6: calore di Sichuan
Ci saranu mudelli 5 in a nova linea. Tutti i mudelli eccettu 3000V6 ponu esse in duie versioni - SAS è NVMe. L'scelta determina l'interfaccia di i dischi chì pudete aduprà in questu sistema, i porti Back-End è u numeru di unità di discu chì pudete installà in u sistema. Per NVMe, sò usati SSD Palm-sized, chì sò più sottili cà i classici SSD SAS 2.5" è ponu esse installati in pezzi 36. A nova linea hè All Flash è ùn ci hè micca cunfigurazione cù dischi.

Huawei Dorado V6: calore di Sichuan
SSD Palm NVMe

In u mo parè, u Dorado 8000 è 18000 s'assumiglia à i mudelli più ntirissanti. Huawei i pusizioni cum'è sistemi High-end, è, grazia à a pulitica di prezzu di Huawei, cuntrasta sti mudelli Mid-range cù u segmentu di cuncurrenti. Sò questi mudelli chì mi fucalizza nantu à a mo rivista oghje. Aghju nutatu subitu chì per via di e so caratteristiche di cuncepimentu, i sistemi junior dual-controller anu una architettura ligeramente sfarente, sfarente di Dorado 8000 è 18000, per quessa, micca tuttu ciò chì parleraghju oghje hè applicabile à mudelli junior.

Una di e caratteristiche principali di i novi sistemi era l'usu di parechji chips, sviluppati in-house, ognuna di quali permette di distribuisce a carica logica da u processatore cintrali di u controller è aghjunghje funziunalità à diversi cumpunenti.
Huawei Dorado V6: calore di Sichuan

U core di i novi sistemi sò i prucessori Kunpeng 920, sviluppati nantu à tecnulugia ARM è fabbricati da Huawei indipindentamente. Sicondu u mudellu, u numeru di core, a so frequenza è u numeru di processori installati in ogni controller varianu:
Huawei Dorado V6 8000 - 2CPU, 64 core
Huawei Dorado V6 18000 - 4CPU, 48 core
Huawei Dorado V6: calore di Sichuan

Huawei hà sviluppatu stu prucessore nantu à l'architettura ARM, è quant'è cunnoscu, inizialmente hà pensatu à stallà solu in i mudelli più vechji di Dorado 8000 è 18000, cum'è era digià u casu cù qualchi mudelli V5, ma e sanzioni facianu aghjustamenti à questa idea. Di sicuru, ARM hà ancu parlatu di ricusà di cooperà cù Huawei durante l'imposizione di sanzioni, ma quì a situazione hè diversa da Intel. Huawei pruduci sti chips indipindentamente, è nisuna sanzione pò piantà stu prucessu. Severing relazioni cù ARM minaccia solu a perdita di l'accessu à novi sviluppi. In quantu à u funziunamentu, serà pussibule ghjudicà solu dopu avè realizatu teste indipendenti. Ancu s'è aghju vistu cumu 18000M IOPS hè stata sguassata da u sistema Dorado 1 senza prublemi, finu à ch'e aghju ripetutu cù e mo mani in u mo rack, ùn crederaghju micca. Ma ci hè veramente assai putere in i cuntrolli. I mudelli più vechji sò equipati di 4 controller, ognunu cù 4 processori, chì dà un totale di 768 core.
Huawei Dorado V6: calore di Sichuan

Ma parleraghju di i nuclei ancu più tardi, quandu avemu vistu l'architettura di i novi sistemi, ma per avà vultemu à un altru chip installatu in u sistema. U chip pare una suluzione estremamente interessante Ascensione 310 (In quantu aghju capitu, u fratellu minore di l'Ascend 910, chì hè statu pocu presentatu à u publicu). U so compitu hè di analizà i blocchi di dati chì entranu in u sistema per aumentà u rapportu di hit Read. Hè difficiuli di dì cumu si farà à u travagliu, perchè ... Oghje travaglia solu secondu un mudellu datu è ùn hà micca a capacità d'amparà in modu intelligente. L'apparizione di un modu intelligente hè prumessu in u futuru firmware, più prubabilmente à principiu di l'annu dopu.

Passemu à l'architettura. Huawei hà cuntinuatu à sviluppà a so propria tecnulugia Smart Matrix, chì implementa un approcciu full mesh à i cumpunenti di cunnessione. Ma se in V5 questu era solu per l'accessu da i cuntrolli à i discu, avà tutti i cuntrolli anu accessu à tutti i porti in u Back-End è u Front-End.
Huawei Dorado V6: calore di Sichuan

Grazie à a nova architettura di microserviziu, questu permette ancu di equilibrà a carica trà tutti i controller, ancu s'ellu ci hè solu un lun. U SO per questa linea di arrays hè statu sviluppatu da a terra, è micca solu ottimizzatu per l'usu di unità Flash. A causa di u fattu chì tutti i nostri cuntrolli anu accessu à i stessi porti, in casu di fallimentu di u controller o reboot, l'ospitu ùn perde micca una sola strada à u sistema di almacenamiento, è u cambiamentu di u percorsu hè realizatu à u livellu di u sistema di almacenamento. Tuttavia, l'usu di UltraPath nantu à l'ospite ùn hè micca strettamente necessariu. Un altru "saving" quandu installate u sistema hè u numeru più chjucu di ligami necessarii. E se cù l'approcciu "classicu" per i cuntrolli 4 avemu bisognu di 8 ligami da 2 fabbriche, allora in u casu di Huawei ancu 2 serà abbastanza (ùn parlu micca avà di a sufficienza di u throughput di un ligame).
Huawei Dorado V6: calore di Sichuan

Cum'è in a versione precedente, hè aduprata una cache globale cù mirroring. Questu permette di perde finu à dui controller simultaneamente o trè controller sequentially senza affettà a dispunibilità. Ma vale a pena nutà chì ùn avemu micca vistu un equilibriu di carica cumpletu trà i 3 controllers restanti in casu di un fallimentu à u stand demo. A carica di u controller fallutu hè stata ripresa interamente da unu di i restanti. Hè pussibule chì per questu hè necessariu di lascià u sistema travaglià più longu in questa cunfigurazione. In ogni casu, verificaraghju questu in più detail cù i mo propri testi.
Huawei posiziona i novi sistemi cum'è sistemi NVMe End-to-End, ma oghje NVMeOF ùn hè ancu supportatu in u front end, solu FC, iSCSI o NFS. À a fine di questu o à u principiu di u prossimu, cum'è l'altri funziunalità, ci hè prumessu u supportu RoCE.
Huawei Dorado V6: calore di Sichuan

I scaffali sò ancu cunnessi à i cuntrolli cù RoCE, è ci hè un inconveniente assuciatu cù questu - l'absenza di una cunnessione "loopback" di i scaffali, cum'è era u casu cù SAS. In u mo parè, questu hè sempre un svantaghju piuttostu grande se pianificate un sistema abbastanza grande. U fattu hè chì tutti i scaffali sò cunnessi in serie, è u fallimentu di unu di i scaffali risultati in l'inaccessibilità cumpleta di tutti l'altri chì seguitanu. In questu casu, per assicurà a tolleranza di difetti, avemu da cunnette tutti i scaffali à i cuntrolli, chì implica un aumentu di u numeru necessariu di porti backend in u sistema.

È una cosa più degne di menzione hè l'aghjurnamentu non disruptive (NDU). Cumu l'aghju dettu sopra, Huawei hà implementatu un approcciu di cuntainer per uperà l'OS per a nova linea Dorado, questu permette di aghjurnà è riavvia i servizii senza a necessità di riavviare completamente u controller. Hè vale a pena menziunà subitu chì alcune aghjurnamenti cuntenenu l'aghjurnamenti di u kernel, è in questu casu, un reboot classicu di i cuntrolli a volte serà sempre necessariu durante l'aghjurnamentu, ma micca sempre. Questu riducerà l'impattu di sta operazione nantu à u sistema produtivu.

In u nostru arsenale, a maiò parte di l'arrays sò da NetApp. Per quessa, pensu chì serà abbastanza logicu s'ellu fate un picculu paragone cù i sistemi cù quale aghju da travaglià assai. Questu ùn hè micca un tentativu di determinà quale hè megliu è quale hè peggiu o quale l'architettura hè più avantaghja. Pruvaraghju di sobriamente è senza fanatisimu paragunà dui approcci diffirenti per risolve u stessu prublema da diversi venditori. Iè, sicuru, in questu casu avemu da cunsiderà i sistemi Huawei in "teoria" è aghju ancu noteu separatamente quelli punti chì sò previsti per esse implementati in versioni di firmware futuri. Chì vantaghji vecu à u mumentu:

  1. Numero di unità NVMe supportate. NetApp hà attualmente 288 di elli, mentri Huawei hà 1600-6400, secondu u mudellu. À u listessu tempu, a capacità utilizable Max di Huawei hè 32PBe, cum'è i sistemi NetApp (per esse più precisi, anu 31.64PBe). E questu malgradu u fattu chì i drive di u stessu voluminu sò supportati (finu à 15Tb). Huawei spiega stu fattu cusì: ùn anu micca avutu l'uppurtunità di assemblà un stand più grande. In teoria, ùn anu micca limitazione di u voluminu, ma simpricimenti ùn anu micca pussutu pruvà ancu stu fattu. Ma quì vale a pena nutà chì e capacità di unità flash oghje sò assai altu, è in u casu di i sistemi NVMe, avemu affruntatu cù u fattu chì 24 unità sò abbastanza per utilizà un sistema di cuntrollu 2 di punta. In cunsiquenza, un aumentu ulteriore di u numeru di dischi in u sistema ùn solu ùn furnisce micca un aumentu di u rendiment, ma ancu avè un effettu male in u rapportu IOPS / Tb. Di sicuru, vale a pena vede quante unità di i sistemi di cuntrollu 4 8000 è 16000 ponu trattà, perchè ... E capacità è u putenziale di u Kunpeng 920 ùn sò micca cumplettamente chjaru.
  2. A prisenza di Lun cum'è u pruprietariu di i sistemi NetApp. Quelli. Un solu controller pò fà operazioni cù a luna, mentre chì u sicondu solu passa IO per ellu stessu. Sistemi Huawei, à u cuntrariu, ùn anu micca i pruprietarii è l'operazioni cù blocchi di dati (compressione, deduplicazione) ponu esse realizati da qualsiasi di i cuntrolli, è ancu scrittu à i discu.
  3. Nisun portu cade quandu unu di i cuntrolli falla. Per alcuni, stu mumentu pare assai criticu. U fondu hè chì u cambiamentu in u sistema di almacenamentu duverà accade più veloce chè da u latu di l'ospite. E s'è in u casu di u listessu NetApp, in pratica avemu trovu un freeze di circa 5 seconde quandu tirà fora u controller è cambiendu i percorsi, allora cun cambià à Huawei avemu sempre à praticà.
  4. Ùn ci hè bisognu di riavvià u controller quandu aghjurnà. Questu soprattuttu hà cuminciatu à preoccupassi cù a liberazione abbastanza frequente di novi versioni è di rami di firmware per NetApps. Iè, alcune aghjurnamenti per Huawei anu sempre bisognu di un riavviu, ma micca tutti.
  5. 4 Controller Huawei per u prezzu di dui controller NetApp. Cumu l'aghju dettu sopra, grazia à a pulitica di prezzu di Huawei, pò cumpete cù Mid-range cù i so mudelli High-end.
  6. A prisenza di chips supplementari in i cuntrolli di scaffali è e carte di portu, chì sò potenzialmente destinati à migliurà l'efficienza di u sistema.

Cons è preoccupazioni in generale:

  1. Cunnessione diretta di scaffali à i cuntrolli o a necessità di un gran numaru di porti back-end per cunnette tutti i scaffali à i cuntrolli.
  2. L'architettura ARM è a prisenza di un gran numaru di chips - quantu efficacità hà da travaglià, è u rendiment serà abbastanza?

A maiò parte di e preoccupazioni è e paure ponu esse dispellate da a prova persunale di a nova linea. Spergu chì pocu dopu a liberazione apparisceranu in Mosca è ci saranu abbastanza per ottene rapidamente unu per i vostri testi. Finu a ora, pudemu dì chì in generale l'approcciu di a cumpagnia pare interessante, è a nova linea pare assai bona cumparatu cù i so cuncurrenti. L'implementazione finale suscite parechje dumande, perchè Videremu parechje cose solu à a fine di l'annu, è forse solu in 2020.

Source: www.habr.com

Add a comment