Huawei Dorado V6: Sičuaņas karstums

Huawei Dorado V6: Sičuaņas karstums
Vasara Maskavā Å”ogad, godÄ«gi sakot, nebija Ä«paÅ”i laba. Tas sākās pārāk agri un ātri, ne visiem bija laiks uz to reaģēt, un tas beidzās jau jÅ«nija beigās. Tāpēc, kad Huawei mani uzaicināja doties uz Ķīnu, uz Čendu pilsētu, kur atrodas viņu RnD centrs, ēnā apskatot laika prognozi +34 grādi, uzreiz piekritu. Galu galā es vairs neesmu vienā vecumā un man ir nedaudz jāsasilda kauli. Taču vēlos atzÄ«mēt, ka bija iespējams sasildÄ«t ne tikai kaulus, bet arÄ« iekÅ”pusi, jo Sičuaņas province, kurā patiesÄ«bā atrodas Čendu, ir slavena ar savu pikantā ēdiena mÄ«lestÄ«bu. Bet tomēr Å”is nav emuārs par ceļojumiem, tāpēc atgriezÄ«simies pie mÅ«su ceļojuma galvenā mērÄ·a - jaunas uzglabāŔanas sistēmu lÄ«nijas - Huawei Dorado V6. Å is raksts jums nedaudz atvilinās no pagātnes, jo... tas tika uzrakstÄ«ts pirms oficiālā paziņojuma, bet publicēts tikai pēc iznākÅ”anas. Un tā, Å”odien mēs tuvāk apskatÄ«sim visu interesanto un garŔīgo, ko Huawei mums ir sagatavojis.

Huawei Dorado V6: Sičuaņas karstums
Jaunajā lÄ«nijā bÅ«s 5 modeļi. Visiem modeļiem, izņemot 3000V6, var bÅ«t divas versijas - SAS un NVMe. Izvēle nosaka Å”ajā sistēmā izmantojamo disku saskarni, aizmugures portus un sistēmā instalējamo diskdziņu skaitu. NVMe gadÄ«jumā tiek izmantoti plaukstas izmēra SSD, kas ir plānāki par klasiskajiem 2.5 collu SAS SSD diskiem, un tos var uzstādÄ«t lÄ«dz pat 36 gabalos. Jaunā lÄ«nija ir All Flash, un tajā nav konfigurāciju ar diskiem.

Huawei Dorado V6: Sičuaņas karstums
Palm NVMe SSD

Manuprāt, visinteresantākie modeļi izskatās Dorado 8000 un 18000. Huawei pozicionē tos kā augstākās klases sistēmas un, pateicoties Huawei cenu politikai, kontrastē Å”os Vidējās klases modeļus ar konkurentu segmentu. TieÅ”i Å”iem modeļiem es Å”odien pievērsÄ«Å”os savā pārskatā. Uzreiz atzÄ«mÄ“Å”u, ka to dizaina iezÄ«mju dēļ jaunākajām divu kontrolieru sistēmām ir nedaudz atŔķirÄ«ga arhitektÅ«ra, kas atŔķiras no Dorado 8000 un 18000, tāpēc ne viss, par ko es Å”odien runāŔu, ir piemērojams jaunākajiem modeļiem.

Viena no galvenajām jauno sistēmu iezÄ«mēm bija vairāku iekŔēji izstrādātu mikroshēmu izmantoÅ”ana, no kurām katra ļauj sadalÄ«t loÄ£isko slodzi no kontrollera centrālā procesora un pievienot funkcionalitāti dažādiem komponentiem.
Huawei Dorado V6: Sičuaņas karstums

Jauno sistēmu sirds ir Kunpeng 920 procesori, kas izstrādāti, izmantojot ARM tehnoloÄ£ijas un kurus Huawei ražo neatkarÄ«gi. AtkarÄ«bā no modeļa kodolu skaits, to biežums un uzstādÄ«to procesoru skaits katrā kontrollerÄ« atŔķiras:
Huawei Dorado V6 8000 ā€“ 2CPU, 64 kodoli
Huawei Dorado V6 18000 ā€“ 4CPU, 48 kodoli
Huawei Dorado V6: Sičuaņas karstums

Huawei Å”o procesoru izstrādāja uz ARM arhitektÅ«ras un, cik man zināms, sākotnēji plānoja to uzstādÄ«t tikai vecākos Dorado 8000 un 18000 modeļos, kā tas jau bija ar dažiem V5 modeļiem, taču sankcijas ieviesa korekcijas Å”ajā idejā. Protams, ARM runāja arÄ« par atteikÅ”anos sadarboties ar Huawei sankciju noteikÅ”anas laikā, taču Å”eit situācija ir savādāka nekā ar Intel. Huawei Ŕīs mikroshēmas ražo neatkarÄ«gi, un nekādas sankcijas nevar apturēt Å”o procesu. AttiecÄ«bu pārrauÅ”ana ar ARM tikai apdraud piekļuves zaudÄ“Å”anu jauniem notikumiem. Par sniegumu varēs spriest tikai pēc neatkarÄ«gu testu veikÅ”anas. Lai gan es redzēju, kā 18000M IOPS tika noņemts no Dorado 1 sistēmas bez problēmām, lÄ«dz es to atkārtoÅ”u ar savām rokām savā plauktā, es tam neticÄ“Å”u. Bet kontrolieros patieŔām ir daudz spēka. Vecāki modeļi ir aprÄ«koti ar 4 kontrolieriem, katrs ar 4 procesoriem, kas kopā nodroÅ”ina 768 kodolus.
Huawei Dorado V6: Sičuaņas karstums

Bet par kodoliem es runāŔu vēl vēlāk, kad aplÅ«kosim jauno sistēmu arhitektÅ«ru, bet pagaidām atgriezÄ«simies pie citas sistēmā uzstādÄ«tas mikroshēmas. Mikroshēma izskatās kā ārkārtÄ«gi interesants risinājums Ascend 310 (Cik saprotu nesen publikai prezentētā Ascend 910 jaunākais brālis). Tās uzdevums ir analizēt sistēmā ienākoÅ”os datu blokus, lai palielinātu Read hit koeficientu. GrÅ«ti pateikt, kā tas darbosies darbā, jo... MÅ«sdienās tas darbojas tikai saskaņā ar doto veidni, un tam nav iespējas mācÄ«ties viedā režīmā. Viedā režīma parādÄ«Å”anās tiek solÄ«ta turpmākajā programmaparatÅ«rā, visticamāk, nākamā gada sākumā.

Pāriesim pie arhitektÅ«ras. Huawei ir turpinājis attÄ«stÄ«t savu Smart Matrix tehnoloÄ£iju, kas ievieÅ” pilna tÄ«kla pieeju komponentu savienoÅ”anai. Bet, ja V5 versijā tas bija paredzēts tikai piekļuvei no kontrolleriem uz diskiem, tagad visiem kontrolleriem ir piekļuve visiem portiem gan aizmugurē, gan priekÅ”galā.
Huawei Dorado V6: Sičuaņas karstums

Pateicoties jaunajai mikropakalpojumu arhitektÅ«rai, tas arÄ« ļauj lÄ«dzsvarot slodzi starp visiem kontrolieriem, pat ja ir tikai viens lun. Å Ä«s masÄ«vu lÄ«nijas operētājsistēma tika izstrādāta no paÅ”a sākuma, nevis vienkārÅ”i optimizēta zibatmiņas disku lietoÅ”anai. Sakarā ar to, ka visiem mÅ«su kontrolieriem ir piekļuve vieniem un tiem paÅ”iem portiem, kontroliera kļūmes vai atsāknÄ“Å”anas gadÄ«jumā resursdators nezaudē nevienu ceļu uz krātuves sistēmu, un ceļu pārslēgÅ”ana tiek veikta krātuves sistēmas lÄ«menÄ«. Tomēr UltraPath izmantoÅ”ana resursdatorā nav absolÅ«ti nepiecieÅ”ama. Vēl viens ā€œtaupÄ«jumsā€, uzstādot sistēmu, ir mazāks nepiecieÅ”amo saiÅ”u skaits. Un, ja ar ā€œklasiskoā€ pieeju 4 kontrolieriem mums vajadzēs 8 saites no 2 rÅ«pnÄ«cām, tad Huawei gadÄ«jumā pietiks pat ar 2 (es tagad nerunāju par vienas saites caurlaidÄ«bas pietiekamÄ«bu).
Huawei Dorado V6: Sičuaņas karstums

Tāpat kā iepriekŔējā versijā, tiek izmantota globālā keÅ”atmiņa ar spoguļoÅ”anu. Tas ļauj zaudēt lÄ«dz diviem kontrolleriem vienlaikus vai trÄ«s kontrolieriem pēc kārtas, neietekmējot pieejamÄ«bu. Bet ir vērts atzÄ«mēt, ka mēs neredzējām pilnÄ«gu slodzes lÄ«dzsvaroÅ”anu starp atlikuÅ”ajiem 3 kontrolieriem vienas kļūmes gadÄ«jumā demonstrācijas stendā. Bojātā kontroliera slodzi pilnÄ«bā pārņēma kāds no atlikuÅ”ajiem. Iespējams, ka Å”im nolÅ«kam ir nepiecieÅ”ams ļaut sistēmai darboties ilgāk Å”ajā konfigurācijā. Jebkurā gadÄ«jumā es to pārbaudÄ«Å”u sÄ«kāk, izmantojot savus testus.
Huawei pozicionē jaunās sistēmas kā end-to-end NVMe sistēmas, taču Å”odien NVMeOF vēl netiek atbalstÄ«ts priekÅ”pusē, tikai FC, iSCSI vai NFS. Å Ä«s programmas beigās vai nākamās sākumā, tāpat kā citas funkcijas, mums tiek solÄ«ts RoCE atbalsts.
Huawei Dorado V6: Sičuaņas karstums

Plaukti ir savienoti arÄ« ar kontrolieriem, izmantojot RoCE, un ar to ir saistÄ«ts viens trÅ«kums - plauktu ā€œcilpasā€ savienojuma trÅ«kums, kā tas bija SAS gadÄ«jumā. Manuprāt, tas joprojām ir diezgan liels trÅ«kums, ja plānojat diezgan lielu sistēmu. Fakts ir tāds, ka visi plaukti ir savienoti virknē, un viena no plauktiem atteice izraisa visu pārējo, kas tai seko, pilnÄ«gu nepieejamÄ«bu. Å ajā gadÄ«jumā, lai nodroÅ”inātu kļūdu toleranci, mums bÅ«s jāpievieno visi plaukti ar kontrolieriem, kas nozÄ«mē, ka sistēmā palielināsies nepiecieÅ”amais aizmugures portu skaits.

Un vēl viena lieta, ko vērts pieminēt, ir netraucējoÅ”s atjauninājums (NDU). Kā jau teicu iepriekÅ”, Huawei ir ieviesis konteinera pieeju operētājsistēmas darbÄ«bai jaunajai Dorado lÄ«nijai, kas ļauj atjaunināt un restartēt pakalpojumus bez nepiecieÅ”amÄ«bas pilnÄ«bā pārstartēt kontrolieri. TÅ«lÄ«t ir vērts pieminēt, ka daži atjauninājumi ietvers kodola atjauninājumus, un Å”ajā gadÄ«jumā atjaunināŔanas laikā dažreiz joprojām bÅ«s nepiecieÅ”ama klasiska kontrolleru atsāknÄ“Å”ana, bet ne vienmēr. Tas samazinās Ŕīs darbÄ«bas ietekmi uz produktÄ«vo sistēmu.

MÅ«su arsenālā lielākā daļa masÄ«vu ir no NetApp. Tāpēc es domāju, ka bÅ«s diezgan loÄ£iski, ja es nedaudz salÄ«dzināŔu ar sistēmām, ar kurām man ir diezgan daudz jāstrādā. Tas nav mēģinājums noteikt, kurÅ” ir labāks un kurÅ” sliktāks vai kura arhitektÅ«ra ir izdevÄ«gāka. Es mēģināŔu prātÄ«gi un bez fanātisma salÄ«dzināt divas dažādas pieejas vienas un tās paÅ”as problēmas risināŔanai no dažādiem pārdevējiem. Jā, protams, Å”ajā gadÄ«jumā mēs izskatÄ«sim Huawei sistēmas ā€œteorijāā€, un es arÄ« atseviŔķi atzÄ«mÄ“Å”u tos punktus, kurus plānots ieviest nākamajās programmaparatÅ«ras versijās. Kādas priekÅ”rocÄ«bas es redzu Å”obrÄ«d:

  1. AtbalstÄ«to NVMe disku skaits. PaÅ”laik NetApp ir 288 no tiem, savukārt Huawei atkarÄ«bā no modeļa ir 1600-6400. Tajā paŔā laikā Huawei maksimālā izmantojamā jauda ir 32 PBe, tāpat kā NetApp sistēmām (precÄ«zāk, tām ir 31.64 PBe). Un tas neskatoties uz to, ka tiek atbalstÄ«ti tāda paÅ”a apjoma diskdziņi (lÄ«dz 15Tb). Huawei Å”o faktu skaidro Ŕādi: viņiem nebija iespējas salikt lielāku stendu. Teorētiski tiem nav apjoma ierobežojumu, taču viņi vienkārÅ”i vēl nav spējuÅ”i pārbaudÄ«t Å”o faktu. Bet Å”eit ir vērts atzÄ«mēt, ka zibatmiņas disku iespējas mÅ«sdienās ir ļoti augstas, un NVMe sistēmu gadÄ«jumā mēs saskaramies ar faktu, ka ir pietiekami 24 diskdziņi, lai izmantotu augstākās klases 2 kontrolieru sistēmu. AttiecÄ«gi tālāka disku skaita palielināŔana sistēmā ne tikai nenodroÅ”inās veiktspējas pieaugumu, bet arÄ« slikti ietekmēs IOPS/Tb attiecÄ«bu. Protams, ir vērts redzēt, cik daudz disku var apstrādāt 4 kontrolleru sistēmas 8000 un 16000, jo... Kunpeng 920 iespējas un potenciāls joprojām nav pilnÄ«bā skaidrs.
  2. Luna kā NetApp sistēmu Ä«paÅ”nieka klātbÅ«tne. Tie. Tikai viens kontrolieris var veikt darbÄ«bas ar mēnesi, bet otrs tikai laiž caur sevi IO. Huawei sistēmām, gluži otrādi, nav Ä«paÅ”nieku un darbÄ«bas ar datu blokiem (saspieÅ”anu, deduplikāciju) var veikt jebkurÅ” no kontrolieriem, kā arÄ« ierakstÄ«t diskos.
  3. Neviens ports nenokrÄ«t, ja kāds no kontrolleriem nedarbojas. Dažiem Å”is brÄ«dis Ŕķiet ārkārtÄ«gi kritisks. BÅ«tÄ«ba ir tāda, ka pārslēgÅ”anai uzglabāŔanas sistēmā jānotiek ātrāk nekā resursdatora pusē. Un, ja tā paÅ”a NetApp gadÄ«jumā praksē konstatējām aptuveni 5 sekunžu sastingumu, izvelkot kontrolieri un pārslēdzot ceļus, tad ar pāreju uz Huawei vēl jāpatrenējas.
  4. AtjaunināŔanas laikā kontrolleris nav jārestartē. Tas mani Ä«paÅ”i sāka uztraukties, jo diezgan bieži tika izlaistas jaunas NetApps versijas un programmaparatÅ«ras filiāles. Jā, dažiem Huawei atjauninājumiem joprojām bÅ«s nepiecieÅ”ama restartÄ“Å”ana, bet ne visiem.
  5. 4 Huawei kontrolieri par divu NetApp kontrolieru cenu. Kā jau teicu iepriekÅ”, pateicoties Huawei cenu politikai, tas var konkurēt ar vidējās klases modeļiem ar saviem augstākās klases modeļiem.
  6. Papildu mikroshēmu klātbÅ«tne plauktu kontrolleros un portu kartēs, kas, iespējams, ir paredzētas sistēmas efektivitātes uzlaboÅ”anai.

Mīnusi un bažas kopumā:

  1. TieÅ”a plauktu savienoÅ”ana ar kontrolieriem vai nepiecieÅ”amÄ«ba pēc liela skaita aizmugures portu, lai savienotu visus plauktus ar kontrolieriem.
  2. ARM arhitektūra un liela skaita mikroshēmu klātbūtne - cik efektīvi tas darbosies, un vai veiktspēja būs pietiekama?

Lielāko daļu bažu un baiļu var kliedēt, personÄ«gi pārbaudot jauno lÄ«niju. Ceru, ka drÄ«z pēc iznākÅ”anas tie parādÄ«sies Maskavā un pietiks, lai ātri vien tādu dabÅ«tu saviem testiem. Pagaidām varam teikt, ka kopumā uzņēmuma pieeja izskatās interesanta, un jaunā lÄ«nija izskatās ļoti labi, salÄ«dzinot ar konkurentiem. GalÄ«gā Ä«stenoÅ”ana rada daudz jautājumu, jo Daudzas lietas redzēsim tikai gada beigās un varbÅ«t tikai 2020. gadā.

Avots: www.habr.com

Pievieno komentāru