Huawei Dorado V6: Sičuano karštis

Huawei Dorado V6: Sičuano karštis
Šių metų vasara Maskvoje, tiesą sakant, nebuvo labai gera. Prasidėjo per anksti ir greitai, ne visi spėjo į tai sureaguoti, o baigėsi jau birželio pabaigoje. Todėl kai Huawei pakvietė vykti į Kiniją, į Čengdu miestą, kur įsikūręs jų RnD centras, pavėsyje pažiūrėjęs į +34 laipsnių orų prognozę, iškart sutikau. Juk aš jau nebe tokio amžiaus ir man reikia šiek tiek pašildyti kaulus. Tačiau noriu pastebėti, kad sušildyti buvo galima ne tik kaulus, bet ir vidų, nes Sičuano provincija, kurioje iš tikrųjų yra Čengdu, garsėja pomėgiu aštriam maistui. Bet vis tiek tai ne kelionių tinklaraštis, tad grįžkime prie pagrindinio mūsų kelionės tikslo – naujos saugojimo sistemų linijos – Huawei Dorado V6. Šis straipsnis šiek tiek nuvils jus iš praeities, nes... buvo parašyta prieš oficialų pranešimą, bet paskelbta tik po išleidimo. Taigi, šiandien atidžiau pažvelgsime į viską, kas įdomu ir skanu, ką Huawei mums paruošė.

Huawei Dorado V6: Sičuano karštis
Naujoje linijoje bus 5 modeliai. Visi modeliai, išskyrus 3000V6, gali būti dviejų versijų – SAS ir NVMe. Pasirinkimas lemia diskų, kuriuos galite naudoti šioje sistemoje, sąsają, Back-End prievadus ir diskų įrenginių, kuriuos galite įdiegti sistemoje, skaičių. NVMe naudojami delno dydžio SSD diskai, kurie yra plonesni už klasikinius 2.5 colio SAS SSD ir gali būti montuojami iki 36 vienetų. Nauja eilutė yra „All Flash“ ir nėra konfigūracijų su diskais.

Huawei Dorado V6: Sičuano karštis
Palm NVMe SSD

Mano nuomone, įdomiausi modeliai atrodo Dorado 8000 ir 18000. Huawei juos pozicionuoja kaip aukščiausios klasės sistemas ir dėl Huawei kainų politikos šiuos vidutinės klasės modelius kontrastuoja su konkurentų segmentu. Būtent šiems modeliams šiandienos apžvalgoje daugiausia dėmesio skirsiu. Iš karto pastebėsiu, kad dėl savo dizaino ypatybių jaunesniųjų dviejų valdiklių sistemos turi šiek tiek kitokią architektūrą, skiriasi nuo Dorado 8000 ir 18000, todėl ne viskas, apie ką šiandien kalbėsiu, tinka jaunesniems modeliams.

Viena iš pagrindinių naujų sistemų ypatybių buvo kelių lustų, sukurtų įmonėje, naudojimas, kurių kiekvienas leidžia paskirstyti valdiklio centrinio procesoriaus loginę apkrovą ir pridėti funkcionalumą skirtingiems komponentams.
Huawei Dorado V6: Sičuano karštis

Naujų sistemų šerdis yra „Kunpeng 920“ procesoriai, sukurti naudojant ARM technologijas ir pagaminti „Huawei“ savarankiškai. Priklausomai nuo modelio, branduolių skaičius, jų dažnis ir kiekviename valdiklyje įdiegtų procesorių skaičius skiriasi:
Huawei Dorado V6 8000 – 2 CPU, 64 branduoliai
Huawei Dorado V6 18000 – 4 CPU, 48 branduoliai
Huawei Dorado V6: Sičuano karštis

„Huawei“ šį procesorių sukūrė ant ARM architektūros ir, kiek žinau, iš pradžių planavo jį įdiegti tik į senesnius „Dorado 8000“ ir „18000“ modelius, kaip jau buvo su kai kuriais V5 modeliais, tačiau sankcijos šią idėją pakoregavo. Žinoma, ARM kalbėjo ir apie atsisakymą bendradarbiauti su Huawei įvedant sankcijas, tačiau čia situacija kitokia nei su Intel. „Huawei“ šiuos lustus gamina savarankiškai ir jokios sankcijos negali sustabdyti šio proceso. Santykių su ARM nutraukimas tik gresia prieigos prie naujų įvykių praradimu. Kalbant apie našumą, bus galima spręsti tik atlikus nepriklausomus testus. Nors mačiau, kaip 18000M IOPS buvo pašalintas iš Dorado 1 sistemos be jokių problemų, bet kol nepakartosiu savo ranka savo stove, nepatikėsiu. Tačiau valdikliuose tikrai yra daug galios. Senesni modeliai aprūpinti 4 valdikliais, kurių kiekvienas turi 4 procesorius, iš viso suteikiančius 768 branduolius.
Huawei Dorado V6: Sičuano karštis

Bet apie branduolius pakalbėsiu dar vėliau, kai pažvelgsime į naujų sistemų architektūrą, bet kol kas grįžkime prie kito sistemoje įdiegto lusto. Lustas atrodo itin įdomus sprendimas Pakilimas 310 m (Kiek suprantu, neseniai visuomenei pristatyto Ascend 910 jaunesnysis brolis). Jo užduotis yra išanalizuoti duomenų blokus, patenkančius į sistemą, siekiant padidinti skaitymo pataikymo koeficientą. Sunku pasakyti, kaip tai seksis darbe, nes... Šiandien jis veikia tik pagal pateiktą šabloną ir neturi galimybės mokytis išmaniuoju režimu. Išmanusis režimas žadamas ateities programinėje įrangoje, greičiausiai kitų metų pradžioje.

Pereikime prie architektūros. „Huawei“ toliau kūrė savo „Smart Matrix“ technologiją, kuri įgyvendina visą tinklinį komponentų sujungimo metodą. Bet jei V5 versijoje tai buvo skirta tik prieigai iš valdiklių į diskus, dabar visi valdikliai turi prieigą prie visų prievadų tiek „Back-End“, tiek prie „Front-End“.
Huawei Dorado V6: Sičuano karštis

Dėl naujos mikro paslaugų architektūros tai taip pat leidžia balansuoti apkrovą tarp visų valdiklių, net jei yra tik vienas lun. Šios masyvų linijos OS buvo sukurta nuo pat pradžių, o ne tik optimizuota naudoti „Flash“ įrenginius. Dėl to, kad visi mūsų valdikliai turi prieigą prie tų pačių prievadų, valdiklio gedimo ar perkrovimo atveju kompiuteris nepraranda nė vieno kelio į saugojimo sistemą, o kelių perjungimas atliekamas saugojimo sistemos lygiu. Tačiau naudoti UltraPath pagrindiniame kompiuteryje nėra griežtai būtina. Kitas „taupymas“ diegiant sistemą yra mažesnis reikalingų nuorodų skaičius. Ir jei taikant „klasikinį“ požiūrį 4 valdikliams mums reikės 8 nuorodų iš 2 gamyklų, tai Huawei atveju užteks net 2 (apie vienos nuorodos pralaidumo pakankamumą dabar nekalbu).
Huawei Dorado V6: Sičuano karštis

Kaip ir ankstesnėje versijoje, naudojama visuotinė talpykla su veidrodžiu. Tai leidžia prarasti iki dviejų valdiklių vienu metu arba tris valdiklius paeiliui, nepažeidžiant pasiekiamumo. Tačiau verta paminėti, kad demonstraciniame stende vieno gedimo atveju nematėme visiško apkrovos balansavimo tarp likusių 3 valdiklių. Sugedusio valdiklio apkrovą visiškai perėmė vienas iš likusių. Gali būti, kad tam reikia leisti sistemai ilgiau veikti šioje konfigūracijoje. Bet kokiu atveju aš tai patikrinsiu išsamiau, naudodamas savo testus.
„Huawei“ pozicionuoja naujas sistemas kaip „End-to-End NVMe“ sistemas, tačiau šiandien NVMeOF priekinėje dalyje dar nepalaikoma, tik FC, iSCSI arba NFS. Šios ar kitos pradžioje, kaip ir kitų funkcijų, mums pažadėtas RoCE palaikymas.
Huawei Dorado V6: Sičuano karštis

Lentynos taip pat yra prijungtos prie valdiklių naudojant RoCE, ir yra vienas su tuo susijęs trūkumas - lentynų „kilpos“ jungties nebuvimas, kaip buvo SAS atveju. Mano nuomone, tai vis tiek yra gana didelis trūkumas, jei planuojate gana didelę sistemą. Faktas yra tas, kad visos lentynos yra sujungtos nuosekliai, o vienos iš lentynų gedimas lemia visišką visų kitų, einančių po jo, neprieinamumą. Tokiu atveju, norėdami užtikrinti atsparumą gedimams, turėsime visas lentynas prijungti prie valdiklių, o tai reiškia, kad sistemoje padidės reikiamas užpakalinių prievadų skaičius.

Ir dar vienas dalykas, kurį verta paminėti, yra nenutrūkstamasis atnaujinimas (NDU). Kaip jau sakiau aukščiau, „Huawei“ įdiegė konteinerio metodą, skirtą naujos „Dorado“ linijos OS valdymui, tai leidžia atnaujinti ir iš naujo paleisti paslaugas visiškai neperkraunant valdiklio. Iš karto verta paminėti, kad kai kuriuose naujinimuose bus branduolio atnaujinimų, o šiuo atveju atnaujinimo metu kartais vis tiek prireiks klasikinio valdiklių perkrovimo, bet ne visada. Tai sumažins šios operacijos poveikį gamybinei sistemai.

Mūsų arsenale didžioji dauguma masyvų yra iš NetApp. Todėl manau, kad būtų visai logiška, jei šiek tiek palyginsiu su sistemomis, su kuriomis tenka nemažai dirbti. Tai nėra bandymas nustatyti, kas yra geresnis, o kas blogesnis ar kieno architektūra yra naudingesnė. Pabandysiu blaiviai ir be fanatizmo palyginti du skirtingus skirtingų pardavėjų tos pačios problemos sprendimo būdus. Taip, žinoma, šiuo atveju Huawei sistemas svarstysime „teoriškai“, taip pat atskirai atkreipsiu dėmesį į tuos punktus, kuriuos planuojama įdiegti būsimose programinės įrangos versijose. Kokius privalumus matau šiuo metu:

  1. Palaikomų NVMe diskų skaičius. Šiuo metu „NetApp“ jų turi 288, o „Huawei“ – 1600–6400, priklausomai nuo modelio. Tuo pačiu metu „Huawei“ maksimali naudingoji talpa yra 32 PBe, kaip ir „NetApp“ sistemos (tiksliau, jos turi 31.64 PBe). Ir tai nepaisant to, kad palaikomi to paties tūrio diskai (iki 15Tb). „Huawei“ šį faktą paaiškina taip: jie neturėjo galimybės surinkti didesnio stendo. Teoriškai jie neturi apimties apribojimo, tačiau jie tiesiog dar negalėjo patikrinti šio fakto. Tačiau čia verta paminėti, kad „flash drives“ galimybės šiandien yra labai didelės, o NVMe sistemų atveju susiduriame su tuo, kad aukščiausios klasės 24 valdiklių sistemai išnaudoti pakanka 2 diskų. Atitinkamai, tolesnis diskų skaičiaus padidėjimas sistemoje ne tik nepadidins našumo, bet ir blogai paveiks IOPS/Tb santykį. Žinoma, verta pamatyti, kiek diskų gali valdyti 4 valdiklių sistemos 8000 ir 16000, nes... „Kunpeng 920“ galimybės ir potencialas vis dar nėra visiškai aiškūs.
  2. Lun kaip NetApp sistemų savininko buvimas. Tie. Tik vienas valdiklis gali atlikti operacijas su mėnuliu, o antrasis tik perduoda IO per save. „Huawei“ sistemos, priešingai, neturi savininkų ir operacijas su duomenų blokais (glaudinimą, deduplikaciją) gali atlikti bet kuris valdiklis, taip pat įrašyti į diskus.
  3. Nė vienas prievadas nenukrenta, kai sugenda vienas iš valdiklių. Kai kuriems šis momentas atrodo itin kritiškas. Esmė ta, kad perjungimas saugojimo sistemoje turėtų vykti greičiau nei pagrindinio kompiuterio pusėje. Ir jei tos pačios NetApp atveju praktiškai aptikome apie 5 sekundžių užšalimą ištraukiant valdiklį ir perjungiant kelius, tai pereinant prie Huawei dar reikia pasitreniruoti.
  4. Atnaujinant nereikia iš naujo paleisti valdiklio. Tai ypač ėmė nerimauti dėl gana dažno naujų „NetApps“ versijų ir programinės aparatinės įrangos šakų išleidimo. Taip, kai kuriuos „Huawei“ naujinimus vis tiek reikės paleisti iš naujo, bet ne visus.
  5. 4 Huawei valdikliai už dviejų NetApp valdiklių kainą. Kaip minėjau aukščiau, dėl „Huawei“ kainų politikos jis gali konkuruoti su vidutinės klasės modeliais su savo aukščiausios klasės modeliais.
  6. Lentynų valdikliuose ir prievadų kortelėse yra papildomų lustų, kurie gali būti skirti sistemos efektyvumui pagerinti.

Trūkumai ir rūpesčiai apskritai:

  1. Tiesioginis lentynų prijungimas prie valdiklių arba daugybės galinių prievadų poreikis sujungti visas lentynas su valdikliais.
  2. ARM architektūra ir daugybės lustų buvimas – kaip efektyviai jis veiks ir ar užteks našumo?

Daugumą rūpesčių ir baimių galima išsklaidyti asmeniškai išbandant naująją liniją. Tikiuosi, kad netrukus po išleidimo jie pasirodys Maskvoje ir jų užteks, kad greitai gautumėte savo tyrimams. Kol kas galime teigti, kad apskritai įmonės požiūris atrodo įdomus, o nauja linija atrodo labai gerai, palyginti su konkurentais. Galutinis įgyvendinimas kelia daug klausimų, nes Daug ką pamatysime tik metų pabaigoje, o gal tik 2020 m.

Šaltinis: www.habr.com

Добавить комментарий