Huawei Dorado V6: Nxehtësia në Sichuan

Huawei Dorado V6: Nxehtësia në Sichuan
Vera në Moskë këtë vit ishte, për të qenë i sinqertë, jo shumë e mirë. Filloi shumë herët dhe shpejt, jo të gjithë kishin kohë për të reaguar ndaj tij dhe përfundoi tashmë në fund të qershorit. Prandaj, kur Huawei më ftoi të shkoja në Kinë, në qytetin e Chengdu, ku ndodhet qendra e tyre RnD, pasi pashë parashikimin e motit prej +34 gradë nën hije, menjëherë rashë dakord. Në fund të fundit, nuk jam më në të njëjtën moshë dhe më duhet të ngroh pak kockat e mia. Por dua të vërej se ishte e mundur të ngroheshin jo vetëm kockat, por edhe të brendshmet, sepse provinca e Sichuan, në të cilën ndodhet në të vërtetë Chengdu, është e famshme për dashurinë e saj për ushqimin pikant. Por megjithatë, ky nuk është një blog për udhëtimet, kështu që le të kthehemi te qëllimi kryesor i udhëtimit tonë - një linjë e re e sistemeve të ruajtjes - Huawei Dorado V6. Ky artikull do t'ju tërheqë pak nga e kaluara, sepse... është shkruar para njoftimit zyrtar, por është publikuar vetëm pas publikimit. Dhe kështu, sot do të hedhim një vështrim më të afërt në gjithçka interesante dhe të shijshme që Huawei ka përgatitur për ne.

Huawei Dorado V6: Nxehtësia në Sichuan
Në linjën e re do të ketë 5 modele. Të gjitha modelet përveç 3000V6 mund të disponohen në dy versione - SAS dhe NVMe. Zgjedhja përcakton ndërfaqen e disqeve që mund të përdorni në këtë sistem, portat Back-End dhe numrin e disqeve të diskut që mund të instaloni në sistem. Për NVMe, përdoren SSD me madhësi palme, të cilat janë më të hollë se SAS-të klasike 2.5" dhe mund të instalohen deri në 36 copë. Linja e re është All Flash dhe nuk ka konfigurime me disqe.

Huawei Dorado V6: Nxehtësia në Sichuan
Palm NVMe SSD

Sipas mendimit tim, Dorado 8000 dhe 18000 duken si modelet më interesante Huawei i pozicionon ato si sisteme të nivelit të lartë dhe, falë politikës së çmimeve të Huawei, i bën kontrast këto modele të rangut të mesëm me segmentin konkurrent. Janë këto modele në të cilat do të përqendrohem në rishikimin tim sot. Do të vërej menjëherë se për shkak të veçorive të tyre të projektimit, sistemet e vogla me kontrollues të dyfishtë kanë një arkitekturë paksa të ndryshme, të ndryshme nga Dorado 8000 dhe 18000, kështu që jo gjithçka për të cilën do të flas sot është e zbatueshme për modelet e reja.

Një nga veçoritë kryesore të sistemeve të reja ishte përdorimi i disa çipave, të zhvilluar në shtëpi, secila prej të cilave ju lejon të shpërndani ngarkesën logjike nga procesori qendror i kontrolluesit dhe të shtoni funksionalitet në komponentë të ndryshëm.
Huawei Dorado V6: Nxehtësia në Sichuan

Zemra e sistemeve të reja janë procesorët Kunpeng 920, të zhvilluara në teknologjitë ARM dhe të prodhuara nga Huawei në mënyrë të pavarur. Në varësi të modelit, numri i bërthamave, frekuenca e tyre dhe numri i procesorëve të instaluar në çdo kontrollues ndryshojnë:
Huawei Dorado V6 8000 – 2CPU, 64 bërthama
Huawei Dorado V6 18000 – 4CPU, 48 bërthama
Huawei Dorado V6: Nxehtësia në Sichuan

Huawei e zhvilloi këtë procesor në arkitekturën ARM, dhe me sa di unë, fillimisht planifikoi ta instalonte vetëm në modelet më të vjetra Dorado 8000 dhe 18000, siç ishte tashmë rasti me disa modele V5, por sanksionet bënë rregullime në këtë ide. Sigurisht, ARM foli edhe për refuzimin e bashkëpunimit me Huawei gjatë vendosjes së sanksioneve, por këtu situata është më ndryshe se me Intel. Huawei i prodhon këto çipa në mënyrë të pavarur dhe asnjë sanksion nuk mund ta ndalojë këtë proces. Ndërprerja e marrëdhënieve me ARM-në kërcënon vetëm humbjen e qasjes në zhvillimet e reja. Sa i përket performancës, do të jetë e mundur të gjykohet vetëm pas kryerjes së testeve të pavarura. Edhe pse pashë se si 18000M IOPS u hoq nga sistemi Dorado 1 pa asnjë problem, derisa ta përsëris me duart e mia në raftin tim, nuk do ta besoj. Por vërtet ka shumë fuqi te kontrollorët. Modelet e vjetra janë të pajisura me 4 kontrollues, secili me 4 procesorë, duke dhënë gjithsej 768 bërthama.
Huawei Dorado V6: Nxehtësia në Sichuan

Por për bërthamat do të flas edhe më vonë, kur të shikojmë arkitekturën e sistemeve të reja, por tani për tani le të kthehemi te një çip tjetër i instaluar në sistem. Çipi duket si një zgjidhje jashtëzakonisht interesante Ngjit 310 (Me sa kuptoj unë, vëllai i vogël i Ascend 910, i cili u prezantua së fundmi në publik). Detyra e tij është të analizojë blloqet e të dhënave që hyjnë në sistem për të rritur raportin e hitit të leximit. Është e vështirë të thuhet se si do të performojë në punë, sepse... Sot funksionon vetëm sipas një shablloni të caktuar dhe nuk ka aftësinë për të mësuar në një mënyrë inteligjente. Shfaqja e një modaliteti inteligjent është premtuar në firmware-in e ardhshëm, ka shumë të ngjarë në fillim të vitit të ardhshëm.

Le të kalojmë në arkitekturë. Huawei ka vazhduar të zhvillojë teknologjinë e vet Smart Matrix, e cila zbaton një qasje të plotë rrjetë për lidhjen e komponentëve. Por nëse në V5 kjo ishte vetëm për akses nga kontrollorët në disqe, tani të gjithë kontrollorët kanë qasje në të gjitha portat si në Back-End ashtu edhe në Front-End.
Huawei Dorado V6: Nxehtësia në Sichuan

Falë arkitekturës së re të mikroservisit, kjo gjithashtu lejon balancimin e ngarkesës midis të gjithë kontrollorëve, edhe nëse ka vetëm një lun. Sistemi operativ për këtë linjë vargjesh u zhvillua nga themeli, dhe jo thjesht i optimizuar për përdorimin e disqeve Flash. Për shkak të faktit se të gjithë kontrollorët tanë kanë akses në të njëjtat porte, në rast të një dështimi ose rindezjeje të kontrolluesit, hosti nuk humbet një rrugë të vetme drejt sistemit të ruajtjes dhe ndërrimi i rrugës kryhet në nivelin e sistemit të ruajtjes. Sidoqoftë, përdorimi i UltraPath në host nuk është rreptësisht i nevojshëm. Një "kursim" tjetër gjatë instalimit të sistemit është numri më i vogël i lidhjeve të nevojshme. Dhe nëse me qasjen "klasike" për 4 kontrollues do të na duhen 8 lidhje nga 2 fabrika, atëherë në rastin e Huawei do të mjaftojnë edhe 2 (nuk po flas tani për mjaftueshmërinë e xhiros së një lidhjeje).
Huawei Dorado V6: Nxehtësia në Sichuan

Ashtu si në versionin e mëparshëm, përdoret një cache globale me pasqyrim. Kjo ju lejon të humbni deri në dy kontrollues njëkohësisht ose tre kontrollues në mënyrë sekuenciale pa ndikuar në disponueshmërinë. Por vlen të përmendet se ne nuk pamë balancim të plotë të ngarkesës midis 3 kontrolluesve të mbetur në rast të një dështimi në stendën demo. Ngarkesa e kontrolluesit të dështuar u mor tërësisht nga një prej atyre që mbetën. Është e mundur që për këtë është e nevojshme që sistemi të punojë më gjatë në këtë konfigurim. Në çdo rast, unë do ta kontrolloj këtë në më shumë detaje duke përdorur testet e mia.
Huawei po i pozicionon sistemet e reja si sisteme NVMe End-to-End, por sot NVMeOF nuk mbështetet ende në pjesën e përparme, vetëm FC, iSCSI ose NFS. Në fund të këtij ose në fillim të tjetrit, si veçoritë e tjera, na premtohet mbështetje RoCE.
Huawei Dorado V6: Nxehtësia në Sichuan

Raftet janë gjithashtu të lidhura me kontrollorët duke përdorur RoCE, dhe ka një pengesë që lidhet me këtë - mungesa e një lidhjeje "loopback" të rafteve, siç ishte rasti me SAS. Sipas mendimit tim, kjo është ende një pengesë mjaft e madhe nëse po planifikoni një sistem mjaft të madh. Fakti është se të gjitha raftet janë të lidhura në seri, dhe dështimi i njërit prej rafteve rezulton në paarritshmëri të plotë të të gjithë të tjerëve që e ndjekin atë. Në këtë rast, për të siguruar tolerancën e gabimeve, do të na duhet të lidhim të gjitha raftet me kontrollorët, gjë që sjell një rritje të numrit të kërkuar të portave mbështetëse në sistem.

Dhe një gjë tjetër që vlen të përmendet është përditësimi jo përçarës (NDU). Siç thashë më lart, Huawei ka zbatuar një qasje kontejneri për funksionimin e sistemit operativ për linjën e re Dorado, kjo ju lejon të përditësoni dhe rinisni shërbimet pa pasur nevojë të rindizni plotësisht kontrolluesin. Vlen të përmendet menjëherë se disa përditësime do të përmbajnë përditësime të kernelit, dhe në këtë rast, një rindezje klasike e kontrollorëve ndonjëherë do të kërkohet ende gjatë përditësimit, por jo gjithmonë. Kjo do të zvogëlojë ndikimin e këtij operacioni në sistemin prodhues.

Në arsenalin tonë, shumica dërrmuese e grupeve janë nga NetApp. Prandaj, mendoj se do të jetë mjaft logjike nëse bëj një krahasim të vogël me sistemet me të cilat duhet të punoj mjaft. Kjo nuk është një përpjekje për të përcaktuar se kush është më i mirë dhe kush është më i keq ose arkitektura e kujt është më e favorshme. Do të përpiqem të krahasoj me maturi dhe pa fanatizëm dy qasje të ndryshme për zgjidhjen e të njëjtit problem nga shitës të ndryshëm. Po, sigurisht, në këtë rast ne do t'i konsiderojmë sistemet Huawei në "teori" dhe gjithashtu do të shënoj veçmas ato pika që janë planifikuar të zbatohen në versionet e ardhshme të firmuerit. Çfarë avantazhesh shoh për momentin:

  1. Numri i disqeve NVMe të mbështetur. NetApp aktualisht ka 288 të tilla, ndërsa Huawei ka 1600-6400, në varësi të modelit. Në të njëjtën kohë, kapaciteti i përdorshëm Max i Huawei është 32PBe, ashtu si sistemet NetApp (për të qenë më të saktë, ato kanë 31.64PBe). Dhe kjo përkundër faktit se disqet me të njëjtin vëllim mbështeten (deri në 15 Tb). Huawei e shpjegon këtë fakt si më poshtë: ata nuk patën mundësinë të montonin një stendë më të madhe. Në teori, ata nuk kanë asnjë kufizim vëllimi, por ata thjesht nuk kanë qenë në gjendje ta testojnë ende këtë fakt. Por këtu vlen të theksohet se aftësitë e disqeve flash sot janë shumë të larta dhe në rastin e sistemeve NVMe jemi përballur me faktin se mjaftojnë 24 disqe për të përdorur një sistem me 2 kontrollues të nivelit të lartë. Prandaj, një rritje e mëtejshme e numrit të disqeve në sistem jo vetëm që nuk do të sigurojë një rritje të performancës, por gjithashtu do të ketë një efekt të keq në raportin IOPS/Tb. Sigurisht, ia vlen të shihet se sa disqe mund të përballojnë sistemet me 4 kontrollues 8000 dhe 16000, sepse ... Aftësitë dhe potenciali i Kunpeng 920 nuk janë ende plotësisht të qarta.
  2. Prania e Lunit si pronar i sistemeve NetApp. Ato. Vetëm një kontrollues mund të kryejë operacione me hënën, ndërsa i dyti kalon vetëm IO përmes vetvetes. Sistemet Huawei, përkundrazi, nuk kanë asnjë pronar dhe operacionet me blloqe të dhënash (ngjeshje, dedublikim) mund të kryhen nga ndonjë prej kontrollorëve, si dhe të shkruhen në disqe.
  3. Asnjë port nuk bie kur një nga kontrollorët dështon. Për disa, ky moment duket jashtëzakonisht kritik. Në fund të fundit është se kalimi brenda sistemit të ruajtjes duhet të ndodhë më shpejt sesa në anën e pritësit. Dhe nëse në rastin e të njëjtit NetApp, në praktikë gjetëm një ngrirje prej rreth 5 sekondash kur nxirrnim kontrolluesin dhe ndërronim shtigjet, atëherë me kalimin në Huawei ne ende duhet të praktikojmë.
  4. Nuk ka nevojë të rindizni kontrolluesin gjatë përditësimit. Kjo veçanërisht filloi të më shqetësonte me lëshimin mjaft të shpeshtë të versioneve të reja dhe degëve të firmuerit për NetApps. Po, disa përditësime për Huawei do të kërkojnë ende një rinisje, por jo të gjitha.
  5. 4 kontrollorë Huawei me çmimin e dy kontrollorëve NetApp. Siç thashë më lart, falë politikës së çmimeve të Huawei, ai mund të konkurrojë me kategorinë e mesme me modelet e tij të nivelit të lartë.
  6. Prania e çipave shtesë në kontrollorët e rafteve dhe kartat e porteve, të cilat potencialisht synojnë të përmirësojnë efikasitetin e sistemit.

Disavantazhet dhe shqetësimet në përgjithësi:

  1. Lidhja e drejtpërdrejtë e rafteve me kontrollorët ose nevoja për një numër të madh portash të pasme për të lidhur të gjitha raftet me kontrollorët.
  2. Arkitektura ARM dhe prania e një numri të madh çipash - sa me efikasitet do të funksionojë dhe a do të jetë e mjaftueshme performanca?

Shumica e shqetësimeve dhe frikës mund të largohen nga testimi personal i linjës së re. Shpresoj që së shpejti pas lëshimit ata do të shfaqen në Moskë dhe do të ketë mjaft prej tyre për të marrë shpejt një për testet tuaja. Deri më tani, mund të themi se në përgjithësi qasja e kompanisë duket interesante, dhe linja e re duket shumë e mirë në krahasim me konkurrentët e saj. Zbatimi përfundimtar ngre shumë pikëpyetje, sepse Do të shohim shumë gjëra vetëm në fund të vitit dhe ndoshta vetëm në vitin 2020.

Burimi: www.habr.com

Shto një koment