Huawei Dorado V6: Sichuani kuumus

Huawei Dorado V6: Sichuani kuumus
Tänavune suvi Moskvas ei olnud ausalt öeldes kuigi hea. See algas liiga vara ja kiiresti, kõik ei jõudnud sellele reageerida ja lõppes juba juuni lõpus. Seetõttu, kui Huawei kutsus mind Hiinasse, Chengdu linna, kus asub nende RnD keskus, sõitma varjus +34 kraadist ilmateadet vaadates kohe nõusse. Lõppude lõpuks pole ma enam sama vana ja ma pean oma konte veidi soojendama. Kuid tahaksin märkida, et soojendada oli võimalik mitte ainult luid, vaid ka sisemust, sest Sichuani provints, kus Chengdu tegelikult asub, on kuulus oma vürtsika toidu armastuse poolest. Kuid siiski pole see reisimise ajaveeb, nii et pöördume tagasi meie reisi põhieesmärgi juurde - uue salvestussüsteemide sarja - Huawei Dorado V6 juurde. See artikkel lehvitab teile veidi minevikust, sest... see oli kirjutatud enne ametlikku teadaannet, kuid avaldatud alles pärast avaldamist. Ja nii, täna vaatame lähemalt kõike huvitavat ja maitsvat, mida Huawei meile valmistanud on.

Huawei Dorado V6: Sichuani kuumus
Uues sarjas on 5 mudelit. Kõik mudelid peale 3000V6 on saadaval kahes versioonis - SAS ja NVMe. Valik määrab selles süsteemis kasutatavate ketaste liidese, taustapordid ja kettadraivide arvu, mida saate süsteemi installida. NVMe jaoks kasutatakse peopesa suurust SSD-d, mis on õhemad kui klassikalised 2.5" SAS SSD-d ja mida saab paigaldada kuni 36 tükki. Uus rida on All Flash ja ketastega konfiguratsioone pole.

Huawei Dorado V6: Sichuani kuumus
Palm NVMe SSD

Minu arvates tunduvad kõige huvitavamad mudelid Dorado 8000 ja 18000. Huawei positsioneerib need tipptasemel süsteemidena ning tänu Huawei hinnapoliitikale vastandab neid keskklassi mudeleid konkurentide segmendile. Just nendele mudelitele keskendun oma tänases ülevaates. Märgin kohe, et nende disainiomaduste tõttu on kahe kontrolleriga juuniorsüsteemidel veidi erinev arhitektuur, mis erineb Dorado 8000 ja 18000 omadest, nii et kõik, millest ma täna räägin, ei kehti noorte mudelite puhul.

Uute süsteemide üks peamisi omadusi oli mitme ettevõttesiseselt välja töötatud kiibi kasutamine, millest igaüks võimaldab jaotada kontrolleri keskprotsessori loogilist koormust ja lisada erinevatele komponentidele funktsionaalsust.
Huawei Dorado V6: Sichuani kuumus

Uute süsteemide südameks on Kunpeng 920 protsessorid, mis on välja töötatud ARM-tehnoloogiatel ja mille Huawei toodab iseseisvalt. Olenevalt mudelist varieerub igas kontrolleris tuumade arv, nende sagedus ja installitud protsessorite arv:
Huawei Dorado V6 8000 – 2 protsessorit, 64 tuuma
Huawei Dorado V6 18000 – 4 protsessorit, 48 tuuma
Huawei Dorado V6: Sichuani kuumus

Huawei töötas selle protsessori välja ARM-arhitektuuril ja minu teada plaanis esialgu paigaldada ainult vanematele Dorado 8000 ja 18000 mudelitele, nagu juba mõne V5 mudeli puhul, kuid sanktsioonid tegid selle idee kohandusi. Muidugi rääkis ARM ka Huaweiga koostööst keeldumisest sanktsioonide kehtestamise ajal, kuid siin on olukord teistsugune kui Inteliga. Huawei toodab neid kiipe iseseisvalt ja ükski sanktsioon ei saa seda protsessi peatada. Suhete katkestamine ARM-iga ähvardab ainult juurdepääsu kaotamisega uutele arendustele. Jõudluse osas on võimalik hinnata alles pärast sõltumatute testide läbiviimist. Kuigi nägin, kuidas 18000M IOPS süsteemist Dorado 1 probleemideta eemaldati, ei usu ma seda seni, kuni ma seda oma kätega riiulis kordan. Kuid kontrollerites on tõesti palju jõudu. Vanemad mudelid on varustatud 4 kontrolleriga, millest igaühel on 4 protsessorit, mis annavad kokku 768 tuuma.
Huawei Dorado V6: Sichuani kuumus

Kuid tuumadest räägin veelgi hiljem, kui vaatleme uute süsteemide arhitektuuri, kuid nüüd pöördume tagasi teise süsteemi installitud kiibi juurde. Kiip tundub äärmiselt huvitav lahendus Tõuske 310 (Niipalju kui mina aru saan, siis hiljuti avalikkuse ette toodud Ascend 910 noorem vend). Selle ülesandeks on analüüsida süsteemi sisenevaid andmeplokke, et suurendada Read tabamuse suhet. Raske öelda, kuidas see tööl toimib, sest... Täna töötab see ainult etteantud malli järgi ja sellel puudub intelligentses režiimis õppimise võimalus. Intelligentse režiimi ilmumist lubatakse tulevases püsivaras, tõenäoliselt järgmise aasta alguses.

Liigume edasi arhitektuuri juurde. Huawei on jätkanud oma Smart Matrixi tehnoloogia arendamist, mis rakendab komponentide ühendamisel täisvõrku. Kuid kui V5-s oli see ainult kontrolleritelt ketastele juurdepääsuks, siis nüüd on kõigil kontrolleritel juurdepääs kõikidele nii taga- kui ka esiotsa portidele.
Huawei Dorado V6: Sichuani kuumus

Tänu uuele mikroteenuse arhitektuurile võimaldab see ka koormuse tasakaalustamist kõigi kontrollerite vahel, isegi kui on ainult üks lun. Selle massiivirea OS töötati välja algusest peale, mitte lihtsalt optimeeritud välkmäluseadmete kasutamiseks. Tänu sellele, et kõigil meie kontrolleritel on juurdepääs samadele portidele, ei kaota kontrolleri rikke või taaskäivitamise korral host ühtki teed salvestussüsteemi ning tee vahetamine toimub salvestussüsteemi tasemel. UltraPathi kasutamine hostis pole aga tingimata vajalik. Teine "sääst" süsteemi installimisel on vajalike linkide väiksem arv. Ja kui “klassikalise” lähenemise korral 4 kontrolleri jaoks vajame 8 linki kahest tehasest, siis Huawei puhul piisab isegi 2-st (ma ei räägi praegu ühe lingi läbilaskevõime piisavusest).
Huawei Dorado V6: Sichuani kuumus

Nagu eelmises versioonis, kasutatakse peegeldamisega globaalset vahemälu. See võimaldab teil kaotada korraga kuni kaks kontrollerit või järjestikku kolm kontrollerit, ilma et see mõjutaks saadavust. Kuid väärib märkimist, et me ei näinud demostendil ühe rikke korral täielikku koormuse tasakaalustamist ülejäänud 3 kontrolleri vahel. Rikutud kontrolleri koormuse võttis täielikult üle üks allesjäänud. Võimalik, et selleks on vaja lasta süsteemil selles konfiguratsioonis kauem töötada. Igal juhul kontrollin seda täpsemalt enda testide abil.
Huawei positsioneerib uued süsteemid end-to-end NVMe süsteemidena, kuid täna ei toetata NVMeOF-i veel esiotsas, vaid ainult FC, iSCSI või NFS. Selle lõpus või järgmise alguses lubatakse meile sarnaselt teistele funktsioonidele RoCE tuge.
Huawei Dorado V6: Sichuani kuumus

Riiulid on ühendatud ka RoCE abil kontrolleritega ja sellega on seotud üks puudus - riiulite "loopback" ühenduse puudumine, nagu SAS-i puhul. Minu arvates on see siiski üsna suur puudus, kui plaanite üsna suurt süsteemi. Fakt on see, et kõik riiulid on järjestikku ühendatud ja ühe riiuli rike toob kaasa kõigi teiste sellele järgnevate täieliku ligipääsmatuse. Sel juhul peame tõrketaluvuse tagamiseks ühendama kõik riiulid kontrolleritega, mis tähendab süsteemis vajaliku taustaportide arvu suurenemist.

Ja veel üks asi, mida tasub mainida, on mittehäiritav värskendus (NDU). Nagu ma eespool ütlesin, on Huawei rakendanud uue Dorado liini OS-i käitamiseks konteineripõhise lähenemisviisi, mis võimaldab teil teenuseid värskendada ja taaskäivitada, ilma et oleks vaja kontrollerit täielikult taaskäivitada. Siinkohal tasub kohe mainida, et mõned uuendused sisaldavad kerneli värskendusi ja sel juhul on uuendamise ajal mõnikord siiski vaja klassikalist kontrollerite taaskäivitamist, kuid mitte alati. See vähendab selle toimingu mõju tootmissüsteemile.

Meie arsenalis on valdav enamus massiive NetAppist. Seetõttu arvan, et on üsna loogiline, kui teen väikese võrdluse süsteemidega, millega pean päris palju tööd tegema. See ei ole katse kindlaks teha, kes on parem ja kes halvem või kelle arhitektuur on soodsam. Püüan kainelt ja ilma fanatismita võrrelda kahte erinevat lähenemist sama probleemi lahendamiseks erinevatelt müüjatelt. Jah, muidugi, sel juhul käsitleme Huawei süsteeme "teoorias" ja märgin eraldi ka need punktid, mida on plaanis tulevastes püsivara versioonides rakendada. Milliseid eeliseid ma hetkel näen:

  1. Toetatud NVMe-draivide arv. NetAppil on neid praegu 288, Huaweil aga 1600-6400, olenevalt mudelist. Samal ajal on Huawei maksimaalne kasutatav võimsus 32 PBe, nagu NetApp süsteemidel (täpsemalt on neil 31.64 PBe). Ja seda hoolimata asjaolust, et toetatakse sama mahuga draive (kuni 15 Tb). Huawei selgitab seda asjaolu järgmiselt: neil polnud võimalust suuremat stendi kokku panna. Teoreetiliselt pole neil mahupiiranguid, kuid nad pole lihtsalt saanud seda fakti veel testida. Kuid siinkohal väärib märkimist, et mälupulkade võimalused on tänapäeval väga kõrged ja NVMe süsteemide puhul seisame silmitsi tõsiasjaga, et tipptasemel 24 kontrolleriga süsteemi kasutamiseks piisab 2 draivist. Sellest tulenevalt ei suurenda süsteemi ketaste arvu edasine suurendamine mitte ainult jõudlust, vaid avaldab halba mõju ka IOPS/Tb suhtele. Muidugi tasub vaadata, kui paljude draividega 4 kontrolleriga süsteemid 8000 ja 16000 hakkama saavad, sest... Kunpeng 920 võimalused ja potentsiaal pole siiani täiesti selged.
  2. Luni olemasolu NetApp süsteemide omanikuna. Need. Kuuga saab toiminguid teha ainult üks kontroller, teine ​​​​laseb IO-d läbi ainult iseenda. Vastupidi, Huawei süsteemidel pole omanikke ja andmeplokkidega toiminguid (tihendamine, dubleerimine) saab teha mis tahes kontroller, aga ka kettale kirjutada.
  3. Ükski port ei lange ühe kontrolleri rikke korral. Mõne jaoks tundub see hetk äärmiselt kriitiline. Põhimõte on see, et salvestussüsteemi sees vahetamine peaks toimuma kiiremini kui hosti poolel. Ja kui sellesama NetAppi puhul leidsime praktikas kontrolleri väljatõmbamisel ja teede vahetamisel ca 5 sekundilise külmumise, siis Huaweile üleminekuga tuleb veel harjutada.
  4. Värskendamise ajal pole vaja kontrollerit taaskäivitada. See hakkas mind eriti muretsema seoses NetAppsi uute versioonide ja püsivara harude üsna sagedase väljalaskmisega. Jah, mõned Huawei värskendused nõuavad siiski taaskäivitamist, kuid mitte kõik.
  5. 4 Huawei pulti kahe NetApp kontrolleri hinnaga. Nagu ma eespool ütlesin, suudab see tänu Huawei hinnapoliitikale oma tippmudelitega konkureerida keskklassiga.
  6. Täiendavate kiipide olemasolu riiulikontrollerites ja pordikaartides, mis on potentsiaalselt mõeldud süsteemi tõhususe parandamiseks.

Miinused ja mured üldiselt:

  1. Riiulite otsene ühendamine kontrolleritega või vajadus suure hulga taustaportide järele, et ühendada kõik riiulid kontrolleritega.
  2. ARM-i arhitektuur ja suure hulga kiipide olemasolu - kui tõhusalt see töötab ja kas jõudlusest piisab?

Enamikku muresid ja hirme saab hajutada uue liini isikliku testimisega. Loodan, et varsti pärast ilmumist ilmuvad need Moskvasse ja neid jätkub, et kiirelt omale katseteks hankida. Seni võib öelda, et üldiselt tundub ettevõtte lähenemine huvitav ning uus liin näeb konkurentidega võrreldes väga hea välja. Lõplik teostus tekitab palju küsimusi, sest Paljusid asju näeme alles aasta lõpus ja võib-olla alles 2020. aastal.

Allikas: www.habr.com

Lisa kommentaar