Huawei Dorado V6: Sichuan-varme

Huawei Dorado V6: Sichuan-varme
Sommeren i Moskva i år var, for å være ærlig, ikke særlig bra. Det startet for tidlig og raskt, ikke alle hadde tid til å reagere på det, og det tok slutt allerede i slutten av juni. Derfor, da Huawei inviterte meg til Kina, til byen Chengdu, hvor deres RnD-senter ligger, etter å ha sett på værmeldingen på +34 grader i skyggen, takket jeg umiddelbart ja. Tross alt er jeg ikke på samme alder lenger, og jeg trenger å varme opp beinene mine litt. Men jeg vil merke at det var mulig å varme ikke bare beinene, men også innsiden, fordi provinsen Sichuan, der Chengdu faktisk ligger, er kjent for sin kjærlighet til krydret mat. Men likevel, dette er ikke en blogg om reise, så la oss gå tilbake til hovedmålet med turen vår - en ny linje med lagringssystemer - Huawei Dorado V6. Denne artikkelen vil vinke deg litt fra fortiden, fordi... den ble skrevet før den offisielle kunngjøringen, men publisert først etter utgivelsen. Og så, i dag skal vi se nærmere på alt interessant og velsmakende som Huawei har forberedt for oss.

Huawei Dorado V6: Sichuan-varme
Det vil være 5 modeller i den nye linjen. Alle modeller bortsett fra 3000V6 kan fås i to versjoner - SAS og NVMe. Valget avgjør grensesnittet til diskene du kan bruke i dette systemet, Back-End-portene og antall diskstasjoner du kan installere i systemet. For NVMe brukes SSD-er i Palm-størrelse, som er tynnere enn klassiske 2.5" SAS SSD-er og kan installeres i opptil 36 deler. Den nye linjen er All Flash og det er ingen konfigurasjoner med disker.

Huawei Dorado V6: Sichuan-varme
Palm NVMe SSD

Etter min mening ser Dorado 8000 og 18000 ut som de mest interessante modellene. Huawei posisjonerer dem som avanserte systemer, og takket være Huaweis prispolitikk kontrasterer den disse mellommodellene med konkurrentsegmentet. Det er disse modellene jeg vil fokusere på i min anmeldelse i dag. Jeg vil merke med en gang at på grunn av designfunksjonene deres, har junior dobbelkontrollersystemer en litt annen arkitektur, forskjellig fra Dorado 8000 og 18000, så ikke alt jeg skal snakke om i dag er aktuelt for juniormodeller.

En av hovedtrekkene til de nye systemene var bruken av flere brikker, utviklet internt, som hver lar deg fordele den logiske belastningen fra kontrollerens sentrale prosessor og legge til funksjonalitet til forskjellige komponenter.
Huawei Dorado V6: Sichuan-varme

Hjertet i de nye systemene er Kunpeng 920-prosessorene, utviklet på ARM-teknologier og produsert av Huawei uavhengig. Avhengig av modellen varierer antall kjerner, frekvensen og antall installerte prosessorer i hver kontroller:
Huawei Dorado V6 8000 – 2CPU, 64 kjerner
Huawei Dorado V6 18000 – 4CPU, 48 kjerner
Huawei Dorado V6: Sichuan-varme

Huawei utviklet denne prosessoren på ARM-arkitekturen, og planla så vidt jeg vet først å installere den bare i de eldre Dorado 8000- og 18000-modellene, som allerede var tilfellet med noen V5-modeller, men sanksjoner gjorde justeringer av denne ideen. ARM snakket selvfølgelig også om å nekte å samarbeide med Huawei under innføringen av sanksjoner, men her er situasjonen annerledes enn med Intel. Huawei produserer disse brikkene uavhengig, og ingen sanksjoner kan stoppe denne prosessen. Å bryte forholdet til ARM truer bare tap av tilgang til nye utviklinger. Når det gjelder ytelse, vil det kun være mulig å bedømme etter å ha utført uavhengige tester. Selv om jeg så hvordan 18000M IOPS ble fjernet fra Dorado 1-systemet uten problemer, vil jeg ikke tro det før jeg gjentar det med mine egne hender i stativet. Men det er virkelig mye kraft i kontrollerene. Eldre modeller er utstyrt med 4 kontrollere, hver med 4 prosessorer, noe som gir totalt 768 kjerner.
Huawei Dorado V6: Sichuan-varme

Men jeg vil snakke om kjernene enda senere, når vi ser på arkitekturen til de nye systemene, men la oss foreløpig gå tilbake til en annen brikke installert i systemet. Brikken ser ut som en ekstremt interessant løsning Stig opp 310 (Så vidt jeg forstår, den yngre broren til Ascend 910, som nylig ble presentert for publikum). Dens oppgave er å analysere datablokker som kommer inn i systemet for å øke Read hit ratio. Det er vanskelig å si hvordan det vil fungere på jobben, fordi... I dag fungerer den kun etter en gitt mal og har ikke evnen til å lære i en intelligent modus. Utseendet til en intelligent modus er lovet i fremtidig fastvare, mest sannsynlig tidlig neste år.

La oss gå videre til arkitektur. Huawei har fortsatt å utvikle sin egen Smart Matrix-teknologi, som implementerer en full mesh-tilnærming for å koble sammen komponenter. Men hvis i V5 dette kun var for tilgang fra kontrollere til disker, har nå alle kontrollere tilgang til alle porter på både Back-End og Front-End.
Huawei Dorado V6: Sichuan-varme

Takket være den nye mikrotjenestearkitekturen tillater dette også lastbalansering mellom alle kontrollere, selv om det bare er én lun. OS for denne serien med arrays ble utviklet fra grunnen av, og ikke bare optimalisert for bruk av Flash-stasjoner. På grunn av det faktum at alle kontrollerene våre har tilgang til de samme portene, mister ikke verten en eneste sti til lagringssystemet i tilfelle en kontrollerfeil eller omstart, og banebytte utføres på lagringssystemnivå. Det er imidlertid ikke strengt tatt nødvendig å bruke UltraPath på verten. En annen "besparelse" når du installerer systemet er det mindre antallet nødvendige koblinger. Og hvis vi med den "klassiske" tilnærmingen for 4 kontrollere vil trenge 8 koblinger fra 2 fabrikker, vil til og med 2 i Huaweis tilfelle være nok (jeg snakker ikke nå om tilstrekkeligheten av gjennomstrømmingen til en kobling).
Huawei Dorado V6: Sichuan-varme

Som i forrige versjon brukes en global cache med speiling. Dette lar deg miste opptil to kontrollere samtidig eller tre kontrollere sekvensielt uten å påvirke tilgjengeligheten. Men det er verdt å merke seg at vi ikke så fullstendig lastbalansering mellom de resterende 3 kontrollerene i tilfelle en feil på demo-standen. Lasten til den mislykkede kontrolleren ble overtatt helt av en av de gjenværende. Det er mulig at for dette er det nødvendig å la systemet fungere lenger i denne konfigurasjonen. Dette skal jeg uansett sjekke nærmere ved hjelp av egne tester.
Huawei posisjonerer de nye systemene som End-to-End NVMe-systemer, men i dag støttes ennå ikke NVMeOF på frontend, kun FC, iSCSI eller NFS. På slutten av denne eller begynnelsen av den neste, som andre funksjoner, er vi lovet RoCE-støtte.
Huawei Dorado V6: Sichuan-varme

Hyllene er også koblet til kontrollerene ved hjelp av RoCE, og det er en ulempe forbundet med dette - fraværet av en "loopback"-kobling av hyllene, slik tilfellet var med SAS. Etter min mening er dette fortsatt en ganske stor ulempe hvis du planlegger et ganske stort system. Faktum er at alle hyllene er koblet i serie, og svikt i en av hyllene resulterer i fullstendig utilgjengelighet for alle de andre som følger den. I dette tilfellet, for å sikre feiltoleranse, må vi koble alle hyller til kontrollere, noe som medfører en økning i det nødvendige antallet backend-porter i systemet.

Og en ting til som er verdt å nevne er non-disruptive update (NDU). Som jeg sa ovenfor, har Huawei implementert en containertilnærming for å betjene OS for den nye Dorado-linjen, dette lar deg oppdatere og starte tjenester på nytt uten å måtte starte kontrolleren helt på nytt. Det er verdt å nevne med en gang at noen oppdateringer vil inneholde kjerneoppdateringer, og i dette tilfellet vil en klassisk omstart av kontrollere noen ganger fortsatt være nødvendig under oppdateringen, men ikke alltid. Dette vil redusere virkningen av denne operasjonen på det produktive systemet.

I vårt arsenal er det store flertallet av arrays fra NetApp. Derfor synes jeg det vil være ganske logisk om jeg gjør en liten sammenligning med systemer som jeg må jobbe ganske mye med. Dette er ikke et forsøk på å bestemme hvem som er bedre og hvem som er dårligere, eller hvis arkitektur er mer fordelaktig. Jeg vil prøve å nøkternt og uten fanatisme sammenligne to forskjellige tilnærminger til å løse det samme problemet fra forskjellige leverandører. Ja, selvfølgelig, i dette tilfellet vil vi vurdere Huawei-systemer i "teori", og jeg vil også merke seg de punktene som er planlagt implementert i fremtidige fastvareversjoner. Hvilke fordeler ser jeg for øyeblikket:

  1. Antall støttede NVMe-stasjoner. NetApp har i dag 288 av dem, mens Huawei har 1600-6400, avhengig av modell. Samtidig er Huaweis maksimale brukbare kapasitet 32PBe, akkurat som NetApp-systemer (for å være mer presis, de har 31.64PBe). Og dette til tross for at stasjoner med samme volum støttes (opptil 15Tb). Huawei forklarer dette faktum som følger: de hadde ikke mulighet til å sette sammen et større stativ. I teorien har de ingen volumbegrensning, men de har rett og slett ikke vært i stand til å teste dette faktum ennå. Men her er det verdt å merke seg at egenskapene til flash-stasjoner i dag er svært høye, og når det gjelder NVMe-systemer, står vi overfor det faktum at 24 stasjoner er nok til å utnytte et topp-end 2-kontrollersystem. Følgelig vil en ytterligere økning i antall disker i systemet ikke bare gi en ytelsesøkning, men vil også ha en dårlig effekt på IOPS/Tb-forholdet. Selvfølgelig er det verdt å se hvor mange stasjoner 4-kontrollersystemene 8000 og 16000 kan håndtere, fordi... Mulighetene og potensialet til Kunpeng 920 er fortsatt ikke helt klart.
  2. Tilstedeværelsen av Lun som eier av NetApp-systemer. De. Bare én kontroller kan utføre operasjoner med månen, mens den andre kun sender IO gjennom seg selv. Huawei-systemer, tvert imot, har ingen eiere, og operasjoner med datablokker (komprimering, deduplisering) kan utføres av hvilken som helst av kontrollerene, samt skrives til disker.
  3. Ingen port faller når en av kontrollerene svikter. For noen ser dette øyeblikket ekstremt kritisk ut. Poenget er at bytte inne i lagringssystemet bør skje raskere enn på vertssiden. Og hvis vi i tilfellet med samme NetApp i praksis fant en frysing på omtrent 5 sekunder når vi trakk ut kontrolleren og byttet bane, så må vi fortsatt øve med å bytte til Huawei.
  4. Du trenger ikke å starte kontrolleren på nytt under oppdatering. Dette begynte spesielt å bekymre meg med den ganske hyppige utgivelsen av nye versjoner og fastvaregrener for NetApps. Ja, noen oppdateringer for Huawei vil fortsatt kreve en omstart, men ikke alle.
  5. 4 Huawei-kontrollere til prisen av to NetApp-kontrollere. Som jeg sa ovenfor, takket være Huaweis prispolitikk, kan den konkurrere med Mid-range med sine avanserte modeller.
  6. Tilstedeværelsen av flere brikker i hyllekontrollere og portkort, som potensielt er ment å forbedre systemets effektivitet.

Ulemper og bekymringer generelt:

  1. Direkte tilkobling av hyller til kontrollere eller behov for et stort antall back-end-porter for å koble alle hyller til kontrollere.
  2. ARM-arkitektur og tilstedeværelsen av et stort antall brikker - hvor effektivt vil det fungere, og vil ytelsen være nok?

De fleste bekymringer og frykt kan fjernes ved personlig testing av den nye linjen. Jeg håper at de snart etter utgivelsen vil dukke opp i Moskva, og det vil være nok av dem til å raskt få en til dine egne tester. Så langt kan vi si at selskapets tilnærming generelt ser interessant ut, og den nye linjen ser veldig bra ut sammenlignet med konkurrentene. Den endelige implementeringen reiser mange spørsmål, fordi Vi vil se mange ting først på slutten av året, og kanskje først i 2020.

Kilde: www.habr.com

Legg til en kommentar