Huawei Dorado V6: Sichuan-hitte

Huawei Dorado V6: Sichuan-hitte
De zomer in Moskou was dit jaar, om eerlijk te zijn, niet erg goed. Het begon te vroeg en te snel, niet iedereen had de tijd om erop te reageren, en het eindigde al eind juni. Daarom, toen Huawei me uitnodigde om naar China te gaan, naar de stad Chengdu, waar hun RnD-centrum is gevestigd, nadat ik de weersvoorspelling van +34 graden in de schaduw had bekeken, stemde ik er onmiddellijk mee in. Ik ben tenslotte niet meer van dezelfde leeftijd en ik moet mijn botten een beetje opwarmen. Maar ik zou willen opmerken dat het mogelijk was om niet alleen de botten, maar ook de binnenkant te verwarmen, omdat de provincie Sichuan, waarin Chengdu zich feitelijk bevindt, beroemd is om zijn liefde voor pittig eten. Maar toch is dit geen blog over reizen, dus laten we terugkeren naar het hoofddoel van onze reis: een nieuwe lijn opslagsystemen: Huawei Dorado V6. Dit artikel zwaait je een beetje terug naar het verleden, want... het is geschreven vóór de officiële aankondiging, maar pas na de release gepubliceerd. En dus zullen we vandaag alles wat interessant en smakelijk is wat Huawei voor ons heeft voorbereid nader bekijken.

Huawei Dorado V6: Sichuan-hitte
Er zullen 5 modellen in de nieuwe lijn zijn. Alle modellen behalve 3000V6 zijn verkrijgbaar in twee versies: SAS en NVMe. De keuze bepaalt de interface van de schijven die u in dit systeem kunt gebruiken, de Back-End-poorten en het aantal schijfstations dat u in het systeem kunt installeren. Voor NVMe wordt gebruik gemaakt van Palm-sized SSD's, die dunner zijn dan klassieke 2.5" SAS SSD's en in maximaal 36 stuks kunnen worden geïnstalleerd. De nieuwe regel is All Flash en er zijn geen configuraties met schijven.

Huawei Dorado V6: Sichuan-hitte
Palm NVMe SSD

Naar mijn mening lijken de Dorado 8000 en 18000 de meest interessante modellen, Huawei positioneert ze als high-end systemen en contrasteert deze middenklasse modellen dankzij het prijsbeleid van Huawei met het concurrerende segment. Het zijn deze modellen waar ik me in mijn recensie van vandaag op zal concentreren. Ik zal meteen opmerken dat junior systemen met dubbele controllers vanwege hun ontwerpkenmerken een iets andere architectuur hebben, anders dan de Dorado 8000 en 18000, dus niet alles waar ik het vandaag over zal hebben, is van toepassing op juniormodellen.

Een van de belangrijkste kenmerken van de nieuwe systemen was het gebruik van verschillende in eigen huis ontwikkelde chips, waarmee je elk de logische belasting van de centrale processor van de controller kunt verdelen en functionaliteit aan verschillende componenten kunt toevoegen.
Huawei Dorado V6: Sichuan-hitte

Het hart van de nieuwe systemen zijn de Kunpeng 920-processors, ontwikkeld op basis van ARM-technologieën en onafhankelijk geproduceerd door Huawei. Afhankelijk van het model variëren het aantal cores, hun frequentie en het aantal geïnstalleerde processors in elke controller:
Huawei Dorado V6 8000 – 2CPU, 64 core
Huawei Dorado V6 18000 – 4CPU, 48 core
Huawei Dorado V6: Sichuan-hitte

Huawei ontwikkelde deze processor op de ARM-architectuur en was, voor zover ik weet, aanvankelijk van plan deze alleen in de oudere Dorado 8000- en 18000-modellen te installeren, zoals al het geval was bij sommige V5-modellen, maar sancties brachten aanpassingen aan dit idee. Natuurlijk had ARM het ook over de weigering om samen te werken met Huawei tijdens het opleggen van sancties, maar hier is de situatie anders dan bij Intel. Huawei produceert deze chips zelfstandig en geen enkele sanctie kan dit proces tegenhouden. Het verbreken van de betrekkingen met ARM bedreigt alleen maar het verlies van toegang tot nieuwe ontwikkelingen. Wat de prestaties betreft, is het alleen mogelijk om te oordelen na het uitvoeren van onafhankelijke tests. Hoewel ik zag hoe 18000M IOPS zonder problemen uit het Dorado 1-systeem werd verwijderd, zal ik het niet geloven totdat ik het met mijn eigen handen in mijn rack herhaal. Maar er zit echt veel kracht in controllers. Oudere modellen zijn uitgerust met 4 controllers, elk met 4 processors, wat een totaal van 768 cores oplevert.
Huawei Dorado V6: Sichuan-hitte

Maar ik zal het nog later over de kernen hebben, als we naar de architectuur van de nieuwe systemen kijken, maar laten we nu terugkeren naar een andere chip die in het systeem is geïnstalleerd. De chip lijkt een uiterst interessante oplossing Ascend 310 (Voor zover ik het begrijp het jongere broertje van de Ascend 910, die onlangs aan het publiek werd gepresenteerd). Zijn taak is het analyseren van datablokken die het systeem binnenkomen om de Read Hit-ratio te vergroten. Het is moeilijk te zeggen hoe hij op het werk zal presteren, omdat... Tegenwoordig werkt het alleen volgens een bepaald sjabloon en heeft het niet de mogelijkheid om in een intelligente modus te leren. De verschijning van een intelligente modus wordt beloofd in toekomstige firmware, hoogstwaarschijnlijk begin volgend jaar.

Laten we verder gaan met de architectuur. Huawei is zijn eigen Smart Matrix-technologie blijven ontwikkelen, die een volledige mesh-benadering implementeert voor het verbinden van componenten. Maar was dit in V5 alleen voor toegang van controllers tot schijven, nu hebben alle controllers toegang tot alle poorten op zowel de Back-End als de Front-End.
Huawei Dorado V6: Sichuan-hitte

Dankzij de nieuwe microservice-architectuur maakt dit ook load-balancing tussen alle controllers mogelijk, zelfs als er maar één lun is. Het besturingssysteem voor deze reeks arrays is vanaf de basis ontwikkeld en niet alleen geoptimaliseerd voor het gebruik van flashdrives. Omdat al onze controllers toegang hebben tot dezelfde poorten, verliest de host bij een controllerstoring of herstart geen enkel pad naar het opslagsysteem en wordt er op het niveau van het opslagsysteem van pad gewisseld. Het gebruik van UltraPath op de host is echter niet strikt noodzakelijk. Een andere “besparing” bij het installeren van het systeem is het kleinere aantal noodzakelijke koppelingen. En als we met de “klassieke” aanpak voor 4 controllers 8 links van 2 fabrieken nodig hebben, dan zullen in het geval van Huawei zelfs 2 voldoende zijn (ik heb het nu niet over de toereikendheid van de doorvoer van één link).
Huawei Dorado V6: Sichuan-hitte

Net als in de vorige versie wordt er gebruik gemaakt van een globale cache met mirroring. Hierdoor kunt u maximaal twee controllers tegelijk of drie controllers achter elkaar kwijtraken, zonder dat dit invloed heeft op de beschikbaarheid. Maar het is vermeldenswaard dat we geen volledige taakverdeling tussen de resterende 3 controllers zagen in het geval van één storing op de demostand. De belasting van de defecte controller werd geheel overgenomen door een van de overgeblevenen. Het kan zijn dat het hiervoor nodig is om het systeem in deze configuratie langer te laten werken. Ik zal dit in ieder geval nader controleren aan de hand van mijn eigen tests.
Huawei positioneert de nieuwe systemen als End-to-End NVMe-systemen, maar vandaag wordt NVMeOF nog niet ondersteund op de front-end, alleen FC, iSCSI of NFS. Aan het einde hiervan of aan het begin van de volgende wordt ons, net als bij andere functies, RoCE-ondersteuning beloofd.
Huawei Dorado V6: Sichuan-hitte

De planken zijn ook verbonden met de controllers met behulp van RoCE, en daar is één nadeel aan verbonden: het ontbreken van een “loopback”-verbinding van de planken, zoals het geval was bij SAS. Naar mijn mening is dit nog steeds een vrij groot nadeel als je een vrij groot systeem plant. Het feit is dat alle planken in serie zijn verbonden, en het falen van een van de planken resulteert in de volledige ontoegankelijkheid van alle andere planken die erop volgen. In dit geval zullen we, om fouttolerantie te garanderen, alle planken met controllers moeten verbinden, wat een toename van het vereiste aantal backend-poorten in het systeem met zich meebrengt.

En nog iets dat het vermelden waard is, is de non-disruptive update (NDU). Zoals ik hierboven al zei, heeft Huawei een containerbenadering geïmplementeerd voor het bedienen van het besturingssysteem voor de nieuwe Dorado-lijn, waardoor je services kunt updaten en opnieuw kunt starten zonder dat je de controller volledig opnieuw hoeft op te starten. Het is de moeite waard om meteen te vermelden dat sommige updates kernelupdates zullen bevatten, en in dit geval zal een klassieke herstart van de controllers soms nog steeds vereist zijn tijdens de update, maar niet altijd. Dit zal de impact van deze operatie op het productieve systeem verminderen.

In ons arsenaal is de overgrote meerderheid van de arrays afkomstig van NetApp. Het lijkt mij dan ook best logisch als ik een kleine vergelijking maak met systemen waar ik best veel mee moet werken. Dit is geen poging om te bepalen wie beter en wie slechter is, of wiens architectuur voordeliger is. Ik zal proberen nuchter en zonder fanatisme twee verschillende benaderingen van verschillende leveranciers voor het oplossen van hetzelfde probleem te vergelijken. Ja, natuurlijk, in dit geval zullen we Huawei-systemen in "theorie" beschouwen en ik zal ook afzonderlijk de punten noteren die gepland zijn om in toekomstige firmwareversies te worden geïmplementeerd. Welke voordelen zie ik momenteel:

  1. Aantal ondersteunde NVMe-schijven. NetApp heeft er momenteel 288, terwijl Huawei er 1600-6400 heeft, afhankelijk van het model. Tegelijkertijd is de maximale bruikbare capaciteit van Huawei 32PBe, net als NetApp-systemen (om preciezer te zijn: ze hebben 31.64PBe). En dit ondanks het feit dat schijven met hetzelfde volume worden ondersteund (tot 15Tb). Huawei legt dit feit als volgt uit: ze hadden niet de mogelijkheid om een ​​grotere stand samen te stellen. In theorie hebben ze geen volumebeperking, maar ze hebben dit feit simpelweg nog niet kunnen testen. Maar hier is het vermeldenswaard dat de mogelijkheden van flashdrives tegenwoordig erg hoog zijn, en in het geval van NVMe-systemen worden we geconfronteerd met het feit dat 24 schijven voldoende zijn om een ​​topklasse systeem met 2 controllers te gebruiken. Dienovereenkomstig zal een verdere toename van het aantal schijven in het systeem niet alleen geen prestatieverbetering opleveren, maar ook een slecht effect hebben op de IOPS/Tb-verhouding. Het is natuurlijk de moeite waard om te zien hoeveel schijven de 4-controllersystemen 8000 en 16000 aankunnen, omdat... De mogelijkheden en potentie van de Kunpeng 920 zijn nog steeds niet helemaal duidelijk.
  2. De aanwezigheid van Lun als eigenaar van NetApp-systemen. Die. Slechts één controller kan operaties uitvoeren met de maan, terwijl de tweede alleen IO door zichzelf doorgeeft. Huawei-systemen hebben daarentegen geen eigenaren en bewerkingen met datablokken (compressie, deduplicatie) kunnen door elk van de controllers worden uitgevoerd en ook naar schijven worden geschreven.
  3. Er valt geen poort weg als een van de controllers uitvalt. Voor sommigen lijkt dit moment uiterst kritiek. Het komt erop neer dat het schakelen binnen het opslagsysteem sneller moet gebeuren dan aan de hostkant. En als we in het geval van dezelfde NetApp in de praktijk een bevriezing van ongeveer 5 seconden aantroffen bij het uittrekken van de controller en het wisselen van pad, dan moeten we bij het overstappen naar Huawei nog oefenen.
  4. Het is niet nodig om de controller opnieuw op te starten tijdens het updaten. Dit baarde mij vooral zorgen vanwege de vrij frequente release van nieuwe versies en firmwarevertakkingen voor NetApps. Ja, sommige updates voor Huawei vereisen nog steeds een herstart, maar niet allemaal.
  5. 4 Huawei-controllers voor de prijs van twee NetApp-controllers. Zoals ik hierboven al zei, kan het dankzij het prijsbeleid van Huawei met zijn high-end modellen concurreren met de middenklasse.
  6. De aanwezigheid van extra chips in plankcontrollers en poortkaarten, die mogelijk bedoeld zijn om de systeemefficiëntie te verbeteren.

Nadelen en zorgen in het algemeen:

  1. Directe aansluiting van planken op controllers of de behoefte aan een groot aantal back-end-poorten om alle planken op controllers aan te sluiten.
  2. ARM-architectuur en de aanwezigheid van een groot aantal chips - hoe efficiënt zal het werken en zullen de prestaties voldoende zijn?

De meeste zorgen en angsten kunnen worden weggenomen door de nieuwe lijn persoonlijk te testen. Ik hoop dat ze kort na de release in Moskou zullen verschijnen en dat er genoeg zullen zijn om er snel een te bemachtigen voor je eigen tests. Tot nu toe kunnen we zeggen dat de aanpak van het bedrijf er over het algemeen interessant uitziet, en dat de nieuwe lijn er erg goed uitziet in vergelijking met zijn concurrenten. De uiteindelijke implementatie roept veel vragen op, want Veel dingen zullen we pas aan het einde van het jaar zien, en misschien pas in 2020.

Bron: www.habr.com

Voeg een reactie