Huawei Dorado V6: calor de Sichuan

Huawei Dorado V6: calor de Sichuan
L'estiu a Moscou d'enguany no ha estat gaire bo. Va començar massa aviat i ràpidament, no tothom va tenir temps de reaccionar, i va acabar ja a finals de juny. Per tant, quan Huawei em va convidar a anar a la Xina, a la ciutat de Chengdu, on es troba el seu centre RnD, després de mirar la previsió meteorològica de +34 graus a l'ombra, vaig acceptar immediatament. Al cap i a la fi, ja no tinc la mateixa edat i necessito escalfar una mica els ossos. Però m'agradaria assenyalar que va ser possible escalfar no només els ossos, sinó també l'interior, perquè la província de Sichuan, on es troba realment Chengdu, és famosa pel seu amor pel menjar picant. Però tot i així, aquest no és un bloc sobre viatges, així que tornem a l'objectiu principal del nostre viatge: una nova línia de sistemes d'emmagatzematge: Huawei Dorado V6. Aquest article us mostrarà una mica del passat, perquè... va ser escrit abans de l'anunci oficial, però només es va publicar després del llançament. I per tant, avui veurem més de prop tot allò interessant i saborós que Huawei ens ha preparat.

Huawei Dorado V6: calor de Sichuan
Hi haurà 5 models a la nova línia. Tots els models excepte el 3000V6 es poden tenir en dues versions: SAS i NVMe. L'elecció determina la interfície dels discs que podeu utilitzar en aquest sistema, els ports back-end i el nombre d'unitats de disc que podeu instal·lar al sistema. Per a NVMe, s'utilitzen discs SSD de mida palma, que són més prims que els clàssics SSD SAS de 2.5" i es poden instal·lar en fins a 36 peces. La nova línia és All Flash i no hi ha configuracions amb discs.

Huawei Dorado V6: calor de Sichuan
SSD Palm NVMe

Al meu parer, els models més interessants semblen els Dorado 8000 i 18000. Huawei els posiciona com a sistemes de gamma alta i, gràcies a la política de preus de Huawei, contrasta aquests models de gamma mitjana amb el segment de la competència. Són aquests models els que em centraré en la meva ressenya d'avui. Notaré de seguida que, a causa de les seves característiques de disseny, els sistemes de controlador dual júnior tenen una arquitectura lleugerament diferent, diferent de la Dorado 8000 i 18000, de manera que no tot el que parlaré avui és aplicable als models júniors.

Una de les característiques principals dels nous sistemes va ser l'ús de diversos xips, desenvolupats internament, cadascun dels quals permet distribuir la càrrega lògica del processador central del controlador i afegir funcionalitat als diferents components.
Huawei Dorado V6: calor de Sichuan

El cor dels nous sistemes són els processadors Kunpeng 920, desenvolupats amb tecnologies ARM i fabricats per Huawei de manera independent. Segons el model, el nombre de nuclis, la seva freqüència i el nombre de processadors instal·lats a cada controlador varien:
Huawei Dorado V6 8000 - 2 CPU, 64 nuclis
Huawei Dorado V6 18000 - 4 CPU, 48 nuclis
Huawei Dorado V6: calor de Sichuan

Huawei va desenvolupar aquest processador amb l'arquitectura ARM i, pel que jo sé, inicialment va plantejar instal·lar-lo només als models antics Dorado 8000 i 18000, com ja passava amb alguns models V5, però les sancions van fer ajustos a aquesta idea. Per descomptat, ARM també va parlar de negar-se a cooperar amb Huawei durant la imposició de sancions, però aquí la situació és diferent a la d'Intel. Huawei produeix aquests xips de manera independent i cap sanció pot aturar aquest procés. La ruptura de les relacions amb ARM només amenaça amb la pèrdua d'accés a nous desenvolupaments. Pel que fa al rendiment, només es podrà jutjar després de realitzar proves independents. Tot i que vaig veure com es va eliminar 18000M IOPS del sistema Dorado 1 sense cap problema, fins que no ho repeteixi amb les meves pròpies mans al bastidor, no m'ho creuré. Però realment hi ha molta potència als controladors. Els models més antics estan equipats amb 4 controladors, cadascun amb 4 processadors, que donen un total de 768 nuclis.
Huawei Dorado V6: calor de Sichuan

Però parlaré dels nuclis encara més endavant, quan mirem l'arquitectura dels nous sistemes, però de moment tornem a un altre xip instal·lat al sistema. El xip sembla una solució molt interessant Pujada 310 (Que jo entenc, el germà petit de l'Ascend 910, que es va presentar recentment al públic). La seva tasca és analitzar els blocs de dades que entren al sistema per augmentar la ràtio d'èxits de lectura. És difícil dir com funcionarà a la feina, perquè... Avui només funciona segons una plantilla determinada i no té la capacitat d'aprendre en un mode intel·ligent. L'aparició d'un mode intel·ligent es promet en el firmware futur, probablement a principis de l'any vinent.

Passem a l'arquitectura. Huawei ha continuat desenvolupant la seva pròpia tecnologia Smart Matrix, que implementa un enfocament de malla completa per connectar components. Però si a la V5 només es tractava d'accés des dels controladors als discs, ara tots els controladors tenen accés a tots els ports tant del back-end com del front-end.
Huawei Dorado V6: calor de Sichuan

Gràcies a la nova arquitectura de microservei, això també permet l'equilibri de càrrega entre tots els controladors, fins i tot si només hi ha un lun. El sistema operatiu per a aquesta línia de matrius es va desenvolupar des de zero, i no només optimitzat per a l'ús de unitats flash. A causa del fet que tots els nostres controladors tenen accés als mateixos ports, en cas d'error o reinici de la controladora, l'amfitrió no perd un sol camí cap al sistema d'emmagatzematge, i el canvi de camí es realitza a nivell del sistema d'emmagatzematge. Tanmateix, utilitzar UltraPath a l'amfitrió no és estrictament necessari. Un altre "estalvi" en instal·lar el sistema és el menor nombre d'enllaços necessaris. I si amb l'enfocament "clàssic" per a 4 controladors necessitarem 8 enllaços de 2 fàbriques, en el cas de Huawei, fins i tot 2 n'hi haurà prou (no parlo ara de la suficiència del rendiment d'un enllaç).
Huawei Dorado V6: calor de Sichuan

Com en la versió anterior, s'utilitza una memòria cau global amb rèplica. Això us permet perdre fins a dos controladors simultàniament o tres controladors seqüencialment sense afectar la disponibilitat. Però val la pena assenyalar que no vam veure un equilibri de càrrega complet entre els 3 controladors restants en cas d'un error a l'estand de demostració. La càrrega del controlador fallit la va assumir completament un dels restants. És possible que per a això sigui necessari deixar que el sistema funcioni més temps en aquesta configuració. En qualsevol cas, ho comprovaré amb més detall mitjançant les meves pròpies proves.
Huawei està posicionant els nous sistemes com a sistemes NVMe d'extrem a extrem, però avui NVMeOF encara no és compatible amb el front end, només FC, iSCSI o NFS. Al final d'aquesta o al començament de la següent, com altres funcions, se'ns promet el suport de RoCE.
Huawei Dorado V6: calor de Sichuan

Els prestatges també estan connectats als controladors mitjançant RoCE, i hi ha un inconvenient associat: l'absència d'una connexió "loopback" dels prestatges, com va ser el cas de SAS. Al meu entendre, aquest és encara un inconvenient bastant gran si esteu planejant un sistema bastant gran. El fet és que tots els prestatges estan connectats en sèrie, i la fallada d'un dels prestatges provoca la total inaccessibilitat de tots els altres que el segueixen. En aquest cas, per garantir la tolerància a errors, haurem de connectar tots els prestatges als controladors, la qual cosa comporta un augment del nombre necessari de ports backend del sistema.

I una cosa més que val la pena esmentar és l'actualització no disruptiva (NDU). Com he dit anteriorment, Huawei ha implementat un enfocament de contenidors per operar el sistema operatiu per a la nova línia Dorado, això us permet actualitzar i reiniciar els serveis sense necessitat de reiniciar completament el controlador. Val la pena esmentar immediatament que algunes actualitzacions contindran actualitzacions del nucli i, en aquest cas, de vegades encara serà necessari un reinici clàssic dels controladors durant l'actualització, però no sempre. Això reduirà l'impacte d'aquesta operació en el sistema productiu.

Al nostre arsenal, la gran majoria de matrius són de NetApp. Per tant, crec que serà força lògic que faci una petita comparació amb sistemes amb els quals he de treballar força. Això no és un intent de determinar qui és millor i qui és pitjor o l'arquitectura de qui és més avantatjosa. Intentaré comparar amb sobria i sense fanatisme dos enfocaments diferents per resoldre el mateix problema de diferents venedors. Sí, és clar, en aquest cas tindrem en compte els sistemes Huawei en "teoria" i també anotaré per separat aquells punts que es preveu implementar en futures versions de firmware. Quins avantatges veig en aquest moment:

  1. Nombre de unitats NVMe compatibles. NetApp en té actualment 288, mentre que Huawei en té 1600-6400, segons el model. Al mateix temps, la capacitat útil màxima de Huawei és de 32 PBe, igual que els sistemes NetApp (per ser més precisos, tenen 31.64 PBe). I això malgrat que s'admeten unitats del mateix volum (fins a 15 Tb). Huawei explica aquest fet de la següent manera: no van tenir l'oportunitat de muntar un estand més gran. En teoria, no tenen limitació de volum, però simplement no han pogut provar aquest fet encara. Però aquí val la pena assenyalar que les capacitats de les unitats flash avui en dia són molt altes, i en el cas dels sistemes NVMe ens trobem amb el fet que 24 unitats són suficients per utilitzar un sistema de 2 controladors de gamma alta. En conseqüència, un nou augment del nombre de discos del sistema no només no augmentarà el rendiment, sinó que també tindrà un efecte dolent en la relació IOPS/Tb. Per descomptat, val la pena veure quantes unitats poden gestionar els sistemes de 4 controladors 8000 i 16000, perquè... Les capacitats i el potencial del Kunpeng 920 encara no estan del tot clars.
  2. La presència de Lun com a propietari dels sistemes NetApp. Aquells. Només un controlador pot realitzar operacions amb la lluna, mentre que el segon només passa IO per si mateix. Els sistemes Huawei, per contra, no tenen cap propietari i les operacions amb blocs de dades (compressió, deduplicació) poden ser realitzades per qualsevol dels controladors, així com escriure en discs.
  3. No hi ha cap port quan falla un dels controladors. Per a alguns, aquest moment sembla extremadament crític. La conclusió és que el canvi dins del sistema d'emmagatzematge hauria de ser més ràpid que al costat de l'amfitrió. I si en el cas de la mateixa NetApp, a la pràctica trobem una congelació d'uns 5 segons en treure el controlador i canviar de camí, llavors amb el canvi a Huawei encara hem de practicar.
  4. No cal reiniciar el controlador durant l'actualització. Això em va començar a preocupar especialment amb el llançament força freqüent de noves versions i branques de firmware per a NetApps. Sí, algunes actualitzacions per a Huawei encara requeriran un reinici, però no totes.
  5. 4 controladors Huawei pel preu de dos controladors NetApp. Com he dit anteriorment, gràcies a la política de preus de Huawei, pot competir amb la gamma mitjana amb els seus models de gamma alta.
  6. La presència de xips addicionals als controladors de prestatge i a les targetes de port, que potencialment tenen com a objectiu millorar l'eficiència del sistema.

Contres i preocupacions en general:

  1. Connexió directa de prestatges als controladors o la necessitat d'un gran nombre de ports de fons per connectar tots els prestatges als controladors.
  2. L'arquitectura ARM i la presència d'un gran nombre de xips: amb quina eficiència funcionarà i el rendiment serà suficient?

La majoria de les preocupacions i pors es poden dissipar amb proves personals de la nova línia. Espero que aviat després del llançament apareguin a Moscou i n'hi hagi prou per obtenir-ne un ràpidament per a les vostres pròpies proves. Fins ara, podem dir que, en general, l'enfocament de l'empresa sembla interessant, i la nova línia té un aspecte molt bo en comparació amb els seus competidors. La implementació final planteja moltes preguntes, perquè Veurem moltes coses només a finals d'any, i potser només el 2020.

Font: www.habr.com

Afegeix comentari