Huawei Dorado V6: Sichuan init

Huawei Dorado V6: Sichuan init
Ang tag-init sa Moscow sa taong ito ay, sa totoo lang, hindi masyadong maganda. Nagsimula ito ng masyadong maaga at mabilis, hindi lahat ay nagkaroon ng oras upang mag-react dito, at natapos na ito sa katapusan ng Hunyo. Kaya naman, nang imbitahan ako ng Huawei na pumunta sa China, sa lungsod ng Chengdu, kung saan matatagpuan ang kanilang RnD center, pagkatapos tingnan ang forecast ng panahon na +34 degrees sa lilim, agad akong pumayag. Pagkatapos ng lahat, hindi na ako kaedad at kailangan kong magpainit ng kaunti. Ngunit nais kong tandaan na posible na magpainit hindi lamang sa mga buto, kundi pati na rin sa loob, dahil ang lalawigan ng Sichuan, kung saan matatagpuan ang Chengdu, ay sikat sa pagmamahal nito sa maanghang na pagkain. Gayunpaman, hindi ito isang blog tungkol sa paglalakbay, kaya bumalik tayo sa pangunahing layunin ng ating paglalakbay - isang bagong linya ng mga sistema ng imbakan - Huawei Dorado V6. Iwawagayway ka ng artikulong ito ng kaunti mula sa nakaraan, dahil... ito ay isinulat bago ang opisyal na anunsyo, ngunit nai-publish lamang pagkatapos ng paglabas. At kaya, ngayon ay susuriin natin ang lahat ng kawili-wili at masarap na inihanda ng Huawei para sa atin.

Huawei Dorado V6: Sichuan init
Magkakaroon ng 5 modelo sa bagong linya. Ang lahat ng mga modelo maliban sa 3000V6 ay maaaring magkaroon sa dalawang bersyon - SAS at NVMe. Tinutukoy ng pagpipilian ang interface ng mga disk na magagamit mo sa system na ito, ang mga Back-End port at ang bilang ng mga disk drive na maaari mong i-install sa system. Para sa NVMe, ginagamit ang mga Palm-sized na SSD, na mas manipis kaysa sa mga klasikong 2.5" SAS SSD at maaaring i-install sa hanggang 36 na piraso. Ang bagong linya ay All Flash at walang mga configuration na may mga disk.

Huawei Dorado V6: Sichuan init
Palm NVMe SSD

Sa palagay ko, mukhang ang Dorado 8000 at 18000 ang pinakakawili-wiling mga modelo. Ipinoposisyon ng Huawei ang mga ito bilang High-end system, at, salamat sa patakaran sa pagpepresyo ng Huawei, inihahambing nito ang mga Mid-range na modelong ito sa segment ng kakumpitensya. Ang mga modelong ito ang aking pagtutuunan ng pansin sa aking pagsusuri ngayon. Mapapansin ko kaagad na dahil sa kanilang mga tampok sa disenyo, ang mga junior dual-controller system ay may bahagyang naiibang arkitektura, naiiba sa Dorado 8000 at 18000, kaya hindi lahat ng pag-uusapan ko ngayon ay naaangkop sa mga junior model.

Ang isa sa mga pangunahing tampok ng mga bagong system ay ang paggamit ng ilang mga chips, na binuo sa loob ng bahay, bawat isa ay nagbibigay-daan sa iyo upang ipamahagi ang lohikal na pag-load mula sa gitnang processor ng controller at magdagdag ng pag-andar sa iba't ibang mga bahagi.
Huawei Dorado V6: Sichuan init

Ang puso ng mga bagong system ay ang Kunpeng 920 processors, na binuo sa mga teknolohiya ng ARM at ginawa ng Huawei nang nakapag-iisa. Depende sa modelo, ang bilang ng mga core, ang kanilang dalas at ang bilang ng mga naka-install na processor sa bawat controller ay nag-iiba:
Huawei Dorado V6 8000 – 2CPU, 64 core
Huawei Dorado V6 18000 – 4CPU, 48 core
Huawei Dorado V6: Sichuan init

Binuo ng Huawei ang processor na ito sa arkitektura ng ARM, at sa pagkakaalam ko, sa una ay binalak na i-install lamang ito sa mas lumang mga modelo ng Dorado 8000 at 18000, tulad ng nangyari sa ilang modelo ng V5, ngunit gumawa ng mga pagsasaayos sa ideyang ito ang mga parusa. Siyempre, napag-usapan din ng ARM ang tungkol sa pagtanggi na makipagtulungan sa Huawei sa panahon ng pagpapataw ng mga parusa, ngunit narito ang sitwasyon ay naiiba kaysa sa Intel. Ang Huawei ay gumagawa ng mga chip na ito nang nakapag-iisa, at walang mga parusa ang makakapigil sa prosesong ito. Ang pagputol ng mga relasyon sa ARM ay nagbabanta lamang sa pagkawala ng access sa mga bagong development. Tulad ng para sa pagganap, posible na hatulan lamang pagkatapos magsagawa ng mga independiyenteng pagsusulit. Bagaman nakita ko kung paano tinanggal ang 18000M IOPS sa sistema ng Dorado 1 nang walang anumang problema, hanggang sa ulitin ko ito gamit ang aking sariling mga kamay sa aking rack, hindi ako maniniwala. Ngunit mayroon talagang maraming kapangyarihan sa mga controllers. Ang mga lumang modelo ay nilagyan ng 4 na controller, bawat isa ay may 4 na processor, na nagbibigay ng kabuuang 768 na mga core.
Huawei Dorado V6: Sichuan init

Ngunit magsasalita ako tungkol sa mga core kahit na sa ibang pagkakataon, kapag tinitingnan natin ang arkitektura ng mga bagong system, ngunit sa ngayon ay bumalik tayo sa isa pang chip na naka-install sa system. Ang chip ay mukhang isang lubhang kawili-wiling solusyon Umakyat sa 310 (As far as I understand, the younger brother of the Ascend 910, which was recently presented to the public). Ang gawain nito ay pag-aralan ang mga bloke ng data na pumapasok sa system upang mapataas ang ratio ng Read hit. Mahirap sabihin kung paano ito gaganap sa trabaho, dahil... Ngayon ito ay gumagana lamang ayon sa isang ibinigay na template at walang kakayahang matuto sa isang intelligent na mode. Ang hitsura ng isang intelligent mode ay ipinangako sa hinaharap na firmware, malamang sa unang bahagi ng susunod na taon.

Lumipat tayo sa arkitektura. Ang Huawei ay patuloy na bumuo ng sarili nitong teknolohiya ng Smart Matrix, na nagpapatupad ng isang buong mesh na diskarte sa pagkonekta ng mga bahagi. Ngunit kung sa V5 ito ay para lamang sa pag-access mula sa mga controller hanggang sa mga disk, ngayon ang lahat ng mga controller ay may access sa lahat ng mga port sa parehong Back-End at Front-End.
Huawei Dorado V6: Sichuan init

Salamat sa bagong arkitektura ng microservice, pinapayagan din nito ang pagbabalanse ng pag-load sa pagitan ng lahat ng mga controller, kahit na mayroon lamang isang lun. Ang OS para sa linyang ito ng mga arrays ay binuo mula sa simula, at hindi simpleng na-optimize para sa paggamit ng mga Flash drive. Dahil sa ang katunayan na ang lahat ng aming mga controllers ay may access sa parehong mga port, sa kaganapan ng isang controller pagkabigo o reboot, ang host ay hindi mawawala ang isang solong path sa storage system, at path switching ay isinasagawa sa antas ng storage system. Gayunpaman, ang paggamit ng UltraPath sa host ay hindi mahigpit na kinakailangan. Ang isa pang "nagse-save" kapag nag-i-install ng system ay ang mas maliit na bilang ng mga kinakailangang link. At kung sa "klasikal" na diskarte para sa 4 na controllers ay kakailanganin namin ng 8 mga link mula sa 2 pabrika, kung gayon sa kaso ng Huawei kahit na 2 ay magiging sapat na (hindi ko pinag-uusapan ngayon ang tungkol sa sapat na throughput ng isang link).
Huawei Dorado V6: Sichuan init

Tulad ng sa nakaraang bersyon, ginagamit ang isang global cache na may mirroring. Nagbibigay-daan ito sa iyong mawalan ng hanggang dalawang controller nang sabay-sabay o tatlong controller nang sunud-sunod nang hindi naaapektuhan ang availability. Ngunit ito ay nagkakahalaga ng noting na hindi namin nakita ang kumpletong load balancing sa pagitan ng natitirang 3 controllers sa kaganapan ng isang pagkabigo sa demo stand. Ang pagkarga ng nabigong controller ay ganap na kinuha ng isa sa mga natitira. Posible na para dito kinakailangan na hayaan ang system na gumana nang mas matagal sa pagsasaayos na ito. Sa anumang kaso, susuriin ko ito nang mas detalyado gamit ang sarili kong mga pagsubok.
Pinoposisyon ng Huawei ang mga bagong system bilang End-to-End NVMe system, ngunit ngayon ay hindi pa sinusuportahan ang NVMeOF sa front end, FC, iSCSI o NFS lang. Sa pagtatapos nito o sa simula ng susunod, tulad ng iba pang mga tampok, ipinangako sa amin ang suporta ng RoCE.
Huawei Dorado V6: Sichuan init

Ang mga istante ay konektado din sa mga controllers gamit ang RoCE, at mayroong isang sagabal na nauugnay dito - ang kawalan ng isang "loopback" na koneksyon ng mga istante, tulad ng nangyari sa SAS. Sa palagay ko, ito ay isang medyo malaking sagabal kung nagpaplano ka ng isang medyo malaking sistema. Ang katotohanan ay ang lahat ng mga istante ay konektado sa serye, at ang pagkabigo ng isa sa mga istante ay nagreresulta sa ganap na hindi naa-access ng lahat ng iba pang sumusunod dito. Sa kasong ito, para matiyak ang fault tolerance, kakailanganin nating ikonekta ang lahat ng istante sa mga controller, na nangangailangan ng pagtaas sa kinakailangang bilang ng mga backend port sa system.

At isa pang bagay na dapat banggitin ay ang non-disruptive update (NDU). Tulad ng sinabi ko sa itaas, ipinatupad ng Huawei ang isang diskarte sa lalagyan sa pagpapatakbo ng OS para sa bagong linya ng Dorado, pinapayagan ka nitong i-update at i-restart ang mga serbisyo nang hindi kinakailangang ganap na i-reboot ang controller. Ito ay nagkakahalaga ng pagbanggit kaagad na ang ilang mga pag-update ay maglalaman ng mga pag-update ng kernel, at sa kasong ito, ang isang klasikong pag-reboot ng mga controller ay minsan ay kinakailangan pa rin sa panahon ng pag-update, ngunit hindi palaging. Bawasan nito ang epekto ng operasyong ito sa produktibong sistema.

Sa aming arsenal, ang karamihan sa mga array ay mula sa NetApp. Samakatuwid, sa palagay ko ay magiging lohikal kung gagawa ako ng isang maliit na paghahambing sa mga sistema kung saan kailangan kong magtrabaho nang husto. Ito ay hindi isang pagtatangka upang matukoy kung sino ang mas mahusay at kung sino ang mas masahol o kung kaninong arkitektura ang mas kapaki-pakinabang. Susubukan kong matino at walang panatisismo na ihambing ang dalawang magkaibang mga diskarte sa paglutas ng parehong problema mula sa iba't ibang mga vendor. Oo, siyempre, sa kasong ito, isasaalang-alang namin ang mga sistema ng Huawei sa "teorya" at hiwalay ko ring papansinin ang mga puntong iyon na binalak na ipatupad sa mga bersyon ng firmware sa hinaharap. Anong mga pakinabang ang nakikita ko sa ngayon:

  1. Bilang ng mga sinusuportahang NVMe drive. Ang NetApp ay kasalukuyang mayroong 288 sa kanila, habang ang Huawei ay mayroong 1600-6400, depende sa modelo. Kasabay nito, ang Max na magagamit na kapasidad ng Huawei ay 32PBe, tulad ng mga NetApp system (upang maging mas tumpak, mayroon silang 31.64PBe). At ito sa kabila ng katotohanan na ang mga drive ng parehong dami ay sinusuportahan (hanggang sa 15Tb). Ipinaliwanag ng Huawei ang katotohanang ito bilang mga sumusunod: hindi sila nagkaroon ng pagkakataong mag-ipon ng mas malaking stand. Sa teorya, wala silang limitasyon sa dami, ngunit hindi pa nila nasusubok ang katotohanang ito. Ngunit narito, nararapat na tandaan na ang mga kakayahan ng mga flash drive ngayon ay napakataas, at sa kaso ng mga NVMe system ay nahaharap tayo sa katotohanan na ang 24 na mga drive ay sapat na upang magamit ang isang top-end na 2-controller system. Alinsunod dito, ang karagdagang pagtaas sa bilang ng mga disk sa system ay hindi lamang magbibigay ng pagtaas ng pagganap, ngunit magkakaroon din ng masamang epekto sa ratio ng IOPS/Tb. Siyempre, sulit na makita kung gaano karaming mga drive ang kayang hawakan ng 4-controller system na 8000 at 16000, dahil... Ang mga kakayahan at potensyal ng Kunpeng 920 ay hindi pa rin ganap na malinaw.
  2. Ang presensya ni Lun bilang may-ari ng mga NetApp system. Yung. Isang controller lamang ang maaaring magsagawa ng mga operasyon kasama ang buwan, habang ang pangalawa ay dumadaan lamang sa IO mismo. Ang mga sistema ng Huawei, sa kabaligtaran, ay walang anumang mga may-ari at mga operasyon na may mga bloke ng data (compression, deduplication) ay maaaring isagawa ng alinman sa mga controllers, pati na rin ang nakasulat sa mga disk.
  3. Walang port na bumaba kapag nabigo ang isa sa mga controllers. Para sa ilan, ang sandaling ito ay mukhang lubhang kritikal. Ang pangunahing bagay ay ang paglipat sa loob ng storage system ay dapat mangyari nang mas mabilis kaysa sa host side. At kung sa kaso ng parehong NetApp, sa pagsasanay ay natagpuan namin ang isang pag-freeze ng mga 5 segundo kapag hinila ang controller at lumilipat ng mga landas, pagkatapos ay sa paglipat sa Huawei kailangan pa rin naming magsanay.
  4. Hindi na kailangang i-restart ang controller kapag nag-a-update. Lalo na itong nagsimulang mag-alala sa akin sa medyo madalas na paglabas ng mga bagong bersyon at mga sangay ng firmware para sa NetApps. Oo, mangangailangan pa rin ng pag-restart ang ilang update para sa Huawei, ngunit hindi lahat.
  5. 4 Huawei controllers para sa presyo ng dalawang NetApp controllers. Gaya ng sinabi ko sa itaas, salamat sa patakaran sa pagpepresyo ng Huawei, maaari itong makipagkumpitensya sa Mid-range sa mga High-end na modelo nito.
  6. Ang pagkakaroon ng mga karagdagang chip sa mga shelf controller at port card, na potensyal na nilayon upang mapabuti ang kahusayan ng system.

Mga kahinaan at alalahanin sa pangkalahatan:

  1. Direktang koneksyon ng mga istante sa mga controller o ang pangangailangan para sa isang malaking bilang ng mga back-end port upang ikonekta ang lahat ng mga istante sa mga controller.
  2. Arkitektura ng ARM at ang pagkakaroon ng malaking bilang ng mga chip - gaano ito kahusay gagana, at magiging sapat ba ang pagganap?

Karamihan sa mga alalahanin at pangamba ay maaaring maalis sa pamamagitan ng personal na pagsubok sa bagong linya. Umaasa ako na sa lalong madaling panahon pagkatapos ng paglabas ay lilitaw sila sa Moscow at magkakaroon ng sapat sa kanila upang mabilis na makakuha ng isa para sa iyong sariling mga pagsubok. Sa ngayon, maaari nating sabihin na sa pangkalahatan ang diskarte ng kumpanya ay mukhang kawili-wili, at ang bagong linya ay mukhang napakahusay kumpara sa mga kakumpitensya nito. Ang panghuling pagpapatupad ay nagtataas ng maraming katanungan, dahil Makikita natin ang maraming bagay sa pagtatapos lamang ng taon, at marahil sa 2020 lamang.

Pinagmulan: www.habr.com

Magdagdag ng komento