Huawei Dorado V6: Sichuan waarmte

Huawei Dorado V6: Sichuan waarmte
Simmer yn Moskou wie dit jier, om earlik te wêzen, net sa goed. It begûn te betiid en fluch, net elkenien hie tiid om der op te reagearjen, en it einige ein juny al. Dêrom, doe't Huawei my útnoege om nei Sina te gean, nei de stêd Chengdu, wêr't har RnD-sintrum leit, nei't ik de waarberjocht fan +34 graden yn 't skaad sjoen hie, gie ik fuortendaliks iens. Ik bin ommers net mear fan deselde leeftyd en moat de bonken wat opwarmje. Mar ik soe graach konstatearje dat it mooglik wie om net allinich de bonken te waarmjen, mar ek de binnenkant, om't de provinsje Sichuan, wêryn Chengdu eins leit, ferneamd is om syn leafde foar pittich iten. Mar dochs is dit gjin blog oer reizen, dus litte wy weromgean nei it haaddoel fan ús reis - in nije line fan opslachsystemen - Huawei Dorado V6. Dit artikel sil jo in bytsje swaaie út it ferline, om't ... it waard skreaun foar de offisjele oankundiging, mar publisearre pas nei de frijlitting. En sa sille wy hjoed in tichterby besjen op alles ynteressant en lekker dat Huawei foar ús hat taret.

Huawei Dorado V6: Sichuan waarmte
D'r sille 5 modellen yn 'e nije line wêze. Alle modellen útsein 3000V6 kinne wurde hie yn twa ferzjes - SAS en NVMe. De kar bepaalt de ynterface fan 'e skiven dy't jo kinne brûke yn dit systeem, de Back-End-poarten en it oantal skiven dat jo kinne ynstallearje yn it systeem. Foar NVMe wurde Palm-sized SSD's brûkt, dy't tinner binne dan klassike 2.5 "SAS SSD's en kinne wurde ynstalleare yn maksimaal 36 stikken. De nije line is All Flash en der binne gjin konfiguraasjes mei skiven.

Huawei Dorado V6: Sichuan waarmte
Palm NVMe SSD

Yn myn miening sjogge de Dorado 8000 en 18000 as de meast nijsgjirrige modellen. Huawei positionearret se as High-end-systemen, en, troch it priisbelied fan Huawei, kontrast it dizze Mid-range-modellen mei it konkurrintsegment. It binne dizze modellen wêrop ik hjoed sil rjochtsje yn myn resinsje. Ik sil daliks opmerke dat troch har ûntwerpfunksjes junior dual-controllersystemen in wat oare arsjitektuer hawwe, oars as Dorado 8000 en 18000, dus net alles wêr't ik hjoed oer praat is fan tapassing op juniormodellen.

Ien fan 'e wichtichste skaaimerken fan' e nije systemen wie it brûken fan ferskate chips, ûntwikkele yn eigen hûs, elk fan dat kinne jo fersprieden de logyske lading fan de controller syn sintrale prosessor en tafoegje funksjonaliteit oan ferskillende komponinten.
Huawei Dorado V6: Sichuan waarmte

It hert fan 'e nije systemen is de Kunpeng 920-processors, ûntwikkele op ARM-technologyen en produsearre troch Huawei ûnôfhinklik. Ofhinklik fan it model ferskille it oantal kearnen, har frekwinsje en it oantal ynstalleare processors yn elke controller:
Huawei Dorado V6 8000 - 2CPU, 64 kearn
Huawei Dorado V6 18000 - 4CPU, 48 kearn
Huawei Dorado V6: Sichuan waarmte

Huawei ûntwikkele dizze prosessor op 'e ARM-arsjitektuer, en foar safier't ik wit, wie it yn earste ynstânsje plannen om it allinich yn' e âldere Dorado 8000 en 18000-modellen te ynstallearjen, lykas al it gefal wie mei guon V5-modellen, mar sanksjes makken oanpassingen oan dit idee. Fansels praat ARM ek oer wegerjen om mei Huawei gear te wurkjen by it oplizzen fan sanksjes, mar hjir is de situaasje oars as mei Intel. Huawei produsearret dizze chips selsstannich, en gjin sanksjes kinne dit proses stopje. It ôfbrekken fan relaasjes mei ARM driget allinich it ferlies fan tagong ta nije ûntjouwings. Wat de prestaasjes oanbelanget, sil it mooglik wêze om allinich te oardieljen nei it útfieren fan ûnôfhinklike tests. Hoewol't ik seach hoe't 18000M IOPS waard fuorthelle út de Dorado 1 systeem sûnder problemen, oant ik werhelje it mei myn eigen hannen yn myn rack, Ik sil it net leauwe. Mar d'r is echt in protte macht yn controllers. Aldere modellen binne foarsjoen fan 4 controllers, elk mei 4 processors, it jaan fan in totaal fan 768 kearnen.
Huawei Dorado V6: Sichuan waarmte

Mar ik sil prate oer de kearnen noch letter, as wy sjogge nei de arsjitektuer fan de nije systemen, mar foar no litte wy werom nei in oare chip ynstallearre yn it systeem. De chip liket in ekstreem nijsgjirrige oplossing Opstean 310 (Sa fier as ik begryp, de jongere broer fan de Ascend 910, dat waard koartlyn presintearre oan it publyk). Syn taak is it analysearjen fan gegevensblokken dy't it systeem ynfiere om de Read hit ratio te ferheegjen. It is lestich om te sizzen hoe't it sil prestearje op it wurk, om't ... Hjoed wurket it allinnich neffens in opjûne sjabloan en hat net de mooglikheid om te learen yn in yntelliginte modus. It uterlik fan in yntelliginte modus wurdt tasein yn takomstige firmware, nei alle gedachten begjin takom jier.

Lit ús gean nei arsjitektuer. Huawei is trochgien mei it ûntwikkeljen fan har eigen Smart Matrix-technology, dy't in folsleine mesh-oanpak ymplementearret foar it ferbinen fan komponinten. Mar as dit yn V5 allinich wie foar tagong fan controllers nei skiven, hawwe no alle controllers tagong ta alle havens op sawol de Back-End as Front-End.
Huawei Dorado V6: Sichuan waarmte

Mei tank oan de nije microservice arsjitektuer, dit kinne ek load balancing tusken alle controllers, sels as der mar ien lun. It OS foar dizze line fan arrays waard ûntwikkele fan 'e grûn ôf, en net gewoan optimalisearre foar it brûken fan Flash-driven. Fanwege it feit dat al ús controllers hawwe tagong ta deselde havens, yn it gefal fan in controller flater of opnij opstarte, de host net ferlieze ien inkeld paad nei it opslach systeem, en paad switching wurdt útfierd op it opslach systeem nivo. It brûken fan UltraPath op 'e host is lykwols net strikt needsaaklik. In oare "besparring" by it ynstallearjen fan it systeem is it lytsere oantal nedige keppelings. En as wy mei de "klassike" oanpak foar 4-controllers 8-keppelings fan 2-fabriken nedich binne, dan sil yn it gefal fan Huawei sels 2 genôch wêze (ik praat no net oer de genôchens fan 'e trochfier fan ien keppeling).
Huawei Dorado V6: Sichuan waarmte

Lykas yn 'e foarige ferzje wurdt in globale cache mei spegeljen brûkt. Hjirmei kinne jo maksimaal twa controllers tagelyk of trije controllers opfolgjend ferlieze sûnder de beskikberens te beynfloedzjen. Mar it is de muoite wurdich op te merken dat wy gjin folsleine load balancing seagen tusken de oerbleaune 3 controllers yn it gefal fan ien flater op de demo stand. De lading fan de mislearre controller waard hielendal oernommen troch ien fan de oerbleaune. It is mooglik dat it hjirfoar nedich is om it systeem langer wurkje te litten yn dizze konfiguraasje. Yn alle gefallen sil ik dit yn mear detail kontrolearje mei myn eigen tests.
Huawei pleatst de nije systemen as End-to-End NVMe-systemen, mar hjoed wurdt NVMeOF noch net stipe op 'e foarkant, allinich FC, iSCSI of NFS. Oan 'e ein fan dit as it begjin fan' e folgjende, lykas oare funksjes, wurde wy RoCE-stipe tasein.
Huawei Dorado V6: Sichuan waarmte

De planken binne ek ferbûn mei de controllers mei RoCE, en d'r is ien nadeel ferbûn mei dit - it ûntbrekken fan in "loopback" ferbining fan 'e planken, lykas it gefal wie mei SAS. Yn myn miening, dit is noch altyd in frij grut nadeel as jo it plannen fan in frij grut systeem. It feit is dat alle planken yn searje ferbûn binne, en it mislearjen fan ien fan 'e planken resultearret yn' e folsleine ûnberikberens fan alle oaren dy't it folgje. Yn dit gefal, om fouttolerânsje te garandearjen, sille wy alle planken moatte ferbine mei controllers, wat in ferheging fan it fereaske oantal backend-poarten yn it systeem meibringt.

En noch ien ding om te neamen is net-fersteurende update (NDU). Lykas ik hjirboppe sei, hat Huawei in konteneroanpak ymplementearre foar it operearjen fan it OS foar de nije Dorado-line, dit kinne jo tsjinsten bywurkje en opnij starte sûnder de needsaak om de controller folslein opnij te begjinnen. Hjir is it de muoite wurdich om fuortdaliks te neamen dat guon updates kernel-updates sille befetsje, en yn dit gefal sil in klassike herstart fan controllers soms noch nedich wêze tidens de fernijing, mar net altyd. Dit sil de ynfloed fan dizze operaasje op it produktive systeem ferminderje.

Yn ús arsenal is de grutte mearderheid fan arrays fan NetApp. Dêrom tink ik dat it frij logysk wêze sil as ik in lytse ferliking meitsje mei systemen dêr't ik aardich mei wurkje moat. Dit is gjin besykjen om te bepalen wa't better is en wa't minder is of waans arsjitektuer foardieliger is. Ik sil besykje sober en sûnder fanatisme twa ferskillende oanpakken te fergelykjen foar it oplossen fan itselde probleem fan ferskate leveransiers. Ja, fansels, yn dit gefal sille wy Huawei-systemen beskôgje yn "teory" en ik sil ek de punten apart notearje dy't pland binne om te ymplementearjen yn takomstige firmwareferzjes. Hokker foardielen sjoch ik op it stuit:

  1. Oantal stipe NVMe-skiven. NetApp hat op it stuit 288 fan har, wylst Huawei 1600-6400 hat, ôfhinklik fan it model. Tagelyk is Huawei's Max brûkbere kapasiteit 32PBe, krekt as NetApp-systemen (om krekter te wêzen, se hawwe 31.64PBe). En dit nettsjinsteande it feit dat driuwfearren fan itselde folume wurde stipe (oant 15Tb). Huawei ferklearret dit feit as folget: se hiene net de kâns om in gruttere stand te sammeljen. Yn teory hawwe se gjin folumebeheining, mar se hawwe dit feit gewoan noch net kinne testen. Mar hjir is it de muoite wurdich op te merken dat de mooglikheden fan flash-driven hjoed tige heech binne, en yn it gefal fan NVMe-systemen wurde wy konfrontearre mei it feit dat 24-skiven genôch binne om in top-end 2-controllersysteem te brûken. Dêrtroch sil in fierdere tanimming fan it oantal skiven yn it systeem net allinnich gjin prestaasjesferheging leverje, mar sil ek in min effekt hawwe op 'e IOPS / Tb-ferhâlding. Fansels is it de muoite wurdich om te sjen hoefolle driuwfearren de 4-controllersystemen 8000 en 16000 kinne omgean, om't ... De mooglikheden en mooglikheden fan 'e Kunpeng 920 binne noch net folslein dúdlik.
  2. De oanwêzigens fan Lun as de eigner fan NetApp-systemen. Dy. Allinich ien kontrôler kin operaasjes útfiere mei de moanne, wylst de twadde allinich IO troch himsels trochgiet. Huawei-systemen, krekt oarsom, hawwe gjin eigners en operaasjes mei gegevensblokken (kompresje, deduplikaasje) kinne wurde útfierd troch ien fan 'e controllers, en ek skreaun nei skiven.
  3. Gjin poarte falt as ien fan 'e controllers mislearret. Foar guon sjocht dit momint ekstreem kritysk. De ûnderste rigel is dat it wikseljen yn it opslachsysteem flugger moat barre dan oan 'e hostkant. En as wy yn it gefal fan deselde NetApp yn 'e praktyk in freeze fan sawat 5 sekonden fûnen by it útlûken fan' e controller en it wikseljen fan paden, dan moatte wy mei it wikseljen nei Huawei noch oefenje.
  4. Gjin needsaak om de controller opnij te starten by it bywurkjen. Dit begon my benammen soargen te meitsjen mei de frij faak frijlitting fan nije ferzjes en firmware-tûken foar NetApps. Ja, guon updates foar Huawei sille noch in herstart fereaskje, mar net allegear.
  5. 4 Huawei-controllers foar de priis fan twa NetApp-controllers. Lykas ik hjirboppe sei, tank oan Huawei's priisbelied, kin it konkurrearje mei Mid-range mei har High-end modellen.
  6. De oanwêzigens fan ekstra chips yn shelf controllers en haven kaarten, dy't mooglik binne bedoeld om te ferbetterjen systeem effisjinsje.

Neidielen en soargen yn it algemien:

  1. Direkte ferbining fan planken oan controllers of it ferlet fan in grut oantal back-end havens te ferbinen alle planken oan controllers.
  2. ARM-arsjitektuer en de oanwêzigens fan in grut oantal chips - hoe effisjint sil it wurkje, en sil de prestaasjes genôch wêze?

De measte soargen en eangsten kinne wurde ferdwûn troch persoanlike testen fan 'e nije line. Ik hoopje dat se gau nei de frijlitting yn Moskou sille ferskine en d'r genôch sille wêze om gau ien te krijen foar jo eigen tests. Oant no kinne wy ​​sizze dat yn 't algemien de oanpak fan it bedriuw ynteressant sjocht, en de nije line sjocht der heul goed út yn ferliking mei syn konkurrinten. De definitive útfiering ropt in soad fragen op, om't Wy sille allinich in protte dingen sjen oan 'e ein fan it jier, en miskien allinich yn 2020.

Boarne: www.habr.com

Add a comment