Huawei Dorado V6: Sichuan-Hitze

Huawei Dorado V6: Sichuan-Hitze
Der Sommer in Moskau war dieses Jahr ehrlich gesagt nicht sehr gut. Es begann zu früh und schnell, nicht jeder hatte Zeit, darauf zu reagieren, und es endete bereits Ende Juni. Als Huawei mich daher einlud, nach China zu reisen, in die Stadt Chengdu, wo sich ihr Forschungs- und Entwicklungszentrum befindet, stimmte ich sofort zu, nachdem ich mir die Wettervorhersage von +34 Grad im Schatten angesehen hatte. Schließlich bin ich nicht mehr so ​​alt und muss meine Knochen ein wenig aufwärmen. Aber ich möchte anmerken, dass es möglich war, nicht nur die Knochen, sondern auch das Innere zu erwärmen, denn die Provinz Sichuan, in der Chengdu eigentlich liegt, ist berühmt für ihre Liebe zu scharfem Essen. Dennoch ist dies kein Blog über Reisen, also kehren wir zum Hauptziel unserer Reise zurück – einer neuen Reihe von Speichersystemen – Huawei Dorado V6. Dieser Artikel wird Sie ein wenig aus der Vergangenheit zurückholen, denn... es wurde vor der offiziellen Ankündigung geschrieben, aber erst nach der Veröffentlichung veröffentlicht. Und so werfen wir heute einen genaueren Blick auf alles Interessante und Leckere, was Huawei für uns vorbereitet hat.

Huawei Dorado V6: Sichuan-Hitze
Die neue Linie wird 5 Modelle umfassen. Alle Modelle außer 3000V6 sind in zwei Versionen erhältlich – SAS und NVMe. Die Auswahl bestimmt die Schnittstelle der Festplatten, die Sie in diesem System verwenden können, die Back-End-Ports und die Anzahl der Festplattenlaufwerke, die Sie im System installieren können. Für NVMe kommen SSDs im Palm-Format zum Einsatz, die dünner als klassische 2.5-Zoll-SAS-SSDs sind und in bis zu 36 Stück verbaut werden können. Die neue Linie ist All Flash und es gibt keine Konfigurationen mit Festplatten.

Huawei Dorado V6: Sichuan-Hitze
Palm NVMe SSD

Die Dorado 8000 und 18000 scheinen meiner Meinung nach die interessantesten Modelle zu sein. Huawei positioniert sie als High-End-Systeme und stellt diese Mittelklasse-Modelle dank der Preispolitik von Huawei dem Konkurrenzsegment gegenüber. Auf diese Modelle werde ich mich heute in meinem Testbericht konzentrieren. Ich möchte sofort anmerken, dass Junior-Dual-Controller-Systeme aufgrund ihrer Designmerkmale eine etwas andere Architektur haben, die sich von Dorado 8000 und 18000 unterscheidet, sodass nicht alles, worüber ich heute sprechen werde, auf Junior-Modelle anwendbar ist.

Eines der Hauptmerkmale der neuen Systeme war die Verwendung mehrerer selbst entwickelter Chips, mit denen Sie jeweils die logische Last vom Zentralprozessor des Controllers verteilen und Funktionen auf verschiedene Komponenten hinzufügen können.
Huawei Dorado V6: Sichuan-Hitze

Das Herzstück der neuen Systeme sind die Kunpeng 920-Prozessoren, die auf ARM-Technologien entwickelt und von Huawei unabhängig hergestellt werden. Je nach Modell variieren die Anzahl der Kerne, deren Frequenz und die Anzahl der verbauten Prozessoren in jedem Controller:
Huawei Dorado V6 8000 – 2 CPU, 64 Kerne
Huawei Dorado V6 18000 – 4 CPU, 48 Kerne
Huawei Dorado V6: Sichuan-Hitze

Huawei hat diesen Prozessor auf der ARM-Architektur entwickelt und hatte meines Wissens zunächst geplant, ihn nur in den älteren Dorado 8000- und 18000-Modellen zu verbauen, wie es bereits bei einigen V5-Modellen der Fall war, doch Sanktionen führten zu Anpassungen dieser Idee. Natürlich sprach ARM auch davon, die Zusammenarbeit mit Huawei während der Sanktionsverhängung zu verweigern, aber hier ist die Situation anders als bei Intel. Huawei produziert diese Chips unabhängig und keine Sanktionen können diesen Prozess stoppen. Ein Abbruch der Beziehungen zu ARM birgt nur die Gefahr, dass der Zugang zu neuen Entwicklungen verloren geht. Eine Beurteilung der Leistung ist erst nach Durchführung unabhängiger Tests möglich. Obwohl ich gesehen habe, wie 18000 Mio. IOPS ohne Probleme aus dem Dorado 1-System entfernt wurden, werde ich es nicht glauben, bis ich es mit meinen eigenen Händen in meinem Rack wiederhole. Aber in Controllern steckt tatsächlich jede Menge Power. Ältere Modelle sind mit 4 Controllern mit jeweils 4 Prozessoren ausgestattet, was insgesamt 768 Kerne ergibt.
Huawei Dorado V6: Sichuan-Hitze

Aber ich werde noch später auf die Kerne eingehen, wenn wir uns die Architektur der neuen Systeme ansehen, aber jetzt kehren wir zu einem anderen im System installierten Chip zurück. Der Chip scheint eine äußerst interessante Lösung zu sein Steigen Sie 310 auf (Soweit ich weiß, der jüngere Bruder des Ascend 910, der kürzlich der Öffentlichkeit vorgestellt wurde). Seine Aufgabe besteht darin, in das System eingehende Datenblöcke zu analysieren, um die Lesetrefferquote zu erhöhen. Es ist schwer zu sagen, wie es bei der Arbeit funktionieren wird, weil... Heutzutage funktioniert es nur nach einer vorgegebenen Vorlage und verfügt nicht über die Fähigkeit, in einem intelligenten Modus zu lernen. Das Erscheinen eines intelligenten Modus wird in zukünftiger Firmware versprochen, höchstwahrscheinlich Anfang nächsten Jahres.

Kommen wir zur Architektur. Huawei hat seine eigene Smart Matrix-Technologie weiterentwickelt, die einen Full-Mesh-Ansatz zur Verbindung von Komponenten implementiert. War dies in V5 jedoch nur für den Zugriff von Controllern auf Festplatten, haben jetzt alle Controller Zugriff auf alle Ports sowohl im Back-End als auch im Front-End.
Huawei Dorado V6: Sichuan-Hitze

Dank der neuen Microservice-Architektur ist dadurch auch ein Lastausgleich zwischen allen Controllern möglich, selbst wenn nur ein Lun vorhanden ist. Das Betriebssystem für diese Array-Reihe wurde von Grund auf neu entwickelt und nicht nur für die Verwendung von Flash-Laufwerken optimiert. Da alle unsere Controller Zugriff auf dieselben Ports haben, verliert der Host im Falle eines Controller-Ausfalls oder Neustarts keinen einzigen Pfad zum Speichersystem und die Pfadumschaltung erfolgt auf Speichersystemebene. Die Verwendung von UltraPath auf dem Host ist jedoch nicht unbedingt erforderlich. Eine weitere „Einsparung“ bei der Installation des Systems ist die geringere Anzahl notwendiger Links. Und wenn wir beim „klassischen“ Ansatz für 4 Controller 8 Links von 2 Fabriken benötigen, dann reichen im Fall von Huawei sogar 2 (ich spreche jetzt nicht von der ausreichenden Durchsatzrate eines Links).
Huawei Dorado V6: Sichuan-Hitze

Wie in der Vorgängerversion kommt ein globaler Cache mit Spiegelung zum Einsatz. Dadurch können Sie bis zu zwei Controller gleichzeitig oder drei Controller nacheinander ausschalten, ohne die Verfügbarkeit zu beeinträchtigen. Es ist jedoch erwähnenswert, dass wir im Falle eines Ausfalls am Demostand keinen vollständigen Lastausgleich zwischen den verbleibenden drei Controllern feststellen konnten. Die Last des ausgefallenen Controllers wurde vollständig von einem der verbleibenden übernommen. Möglicherweise ist es hierfür erforderlich, das System in dieser Konfiguration länger arbeiten zu lassen. Ich werde dies auf jeden Fall anhand eigener Tests noch genauer prüfen.
Huawei positioniert die neuen Systeme als End-to-End-NVMe-Systeme, allerdings wird NVMeOF heute noch nicht am Frontend unterstützt, sondern nur FC, iSCSI oder NFS. Am Ende dieses oder Anfang des nächsten wird uns, wie bei anderen Features auch, RoCE-Unterstützung versprochen.
Huawei Dorado V6: Sichuan-Hitze

Die Regale sind auch über RoCE mit den Controllern verbunden, und damit ist ein Nachteil verbunden: das Fehlen einer „Loopback“-Verbindung der Regale, wie es bei SAS der Fall war. Meiner Meinung nach ist dies immer noch ein ziemlich großes Manko, wenn man eine größere Anlage plant. Tatsache ist, dass alle Regale in Reihe geschaltet sind und der Ausfall eines der Regale zur völligen Unzugänglichkeit aller darauf folgenden Regale führt. In diesem Fall müssen wir zur Gewährleistung der Fehlertoleranz alle Regale mit Controllern verbinden, was eine Erhöhung der erforderlichen Anzahl von Backend-Ports im System zur Folge hat.

Und noch etwas Erwähnenswertes ist das unterbrechungsfreie Update (NDU). Wie ich oben bereits sagte, hat Huawei einen Container-Ansatz für den Betrieb des Betriebssystems für die neue Dorado-Reihe implementiert, der es Ihnen ermöglicht, Dienste zu aktualisieren und neu zu starten, ohne den Controller komplett neu starten zu müssen. Erwähnenswert ist gleich, dass einige Updates Kernel-Updates beinhalten und in diesem Fall ein klassischer Neustart der Controller während des Updates manchmal noch erforderlich ist, aber nicht immer. Dadurch werden die Auswirkungen dieses Vorgangs auf das Produktivsystem verringert.

In unserem Arsenal stammt die überwiegende Mehrheit der Arrays von NetApp. Deshalb halte ich es für ganz logisch, wenn ich einen kleinen Vergleich mit Systemen mache, mit denen ich ziemlich viel arbeiten muss. Dies ist kein Versuch festzustellen, wer besser und wer schlechter ist oder wessen Architektur vorteilhafter ist. Ich werde versuchen, nüchtern und ohne Fanatismus zwei verschiedene Lösungsansätze für dasselbe Problem von verschiedenen Anbietern zu vergleichen. Ja, natürlich betrachten wir in diesem Fall Huawei-Systeme in der „Theorie“ und ich werde auch die Punkte gesondert erwähnen, die in zukünftigen Firmware-Versionen implementiert werden sollen. Welche Vorteile sehe ich derzeit:

  1. Anzahl der unterstützten NVMe-Laufwerke. NetApp verfügt derzeit über 288 davon, Huawei über 1600-6400, je nach Modell. Gleichzeitig beträgt die maximal nutzbare Kapazität von Huawei 32 PBe, genau wie bei NetApp-Systemen (genauer gesagt 31.64 PBe). Und das, obwohl Laufwerke mit demselben Volumen unterstützt werden (bis zu 15 TB). Huawei erklärt diesen Umstand wie folgt: Man hatte keine Möglichkeit, einen größeren Stand aufzubauen. Theoretisch gibt es keine Lautstärkebeschränkung, aber sie konnten diese Tatsache bisher einfach nicht testen. Hier ist jedoch anzumerken, dass die Leistungsfähigkeit von Flash-Laufwerken heutzutage sehr hoch ist und wir im Fall von NVMe-Systemen mit der Tatsache konfrontiert sind, dass 24 Laufwerke ausreichen, um ein Top-End-2-Controller-System zu nutzen. Dementsprechend führt eine weitere Erhöhung der Anzahl der Festplatten im System nicht nur zu keiner Leistungssteigerung, sondern wirkt sich auch negativ auf das IOPS/Tb-Verhältnis aus. Natürlich ist es sehenswert, wie viele Antriebe die 4-Controller-Systeme 8000 und 16000 bewältigen, denn... Die Fähigkeiten und das Potenzial des Kunpeng 920 sind noch nicht vollständig klar.
  2. Die Anwesenheit von Lun als Eigentümer von NetApp-Systemen. Diese. Nur ein Controller kann Operationen mit dem Mond durchführen, während der zweite Controller nur IO durch sich selbst leitet. Huawei-Systeme hingegen haben keine Eigentümer und Vorgänge mit Datenblöcken (Komprimierung, Deduplizierung) können von jedem der Controller durchgeführt und auch auf Festplatten geschrieben werden.
  3. Wenn einer der Controller ausfällt, fällt kein Port weg. Für manche sieht dieser Moment äußerst kritisch aus. Unterm Strich sollte der Wechsel innerhalb des Speichersystems schneller erfolgen als auf der Host-Seite. Und wenn wir bei derselben NetApp in der Praxis beim Herausziehen des Controllers und beim Umschalten der Pfade ein Einfrieren von etwa 5 Sekunden festgestellt haben, müssen wir beim Wechsel zu Huawei noch üben.
  4. Beim Update muss der Controller nicht neu gestartet werden. Dies machte mir vor allem wegen der relativ häufigen Veröffentlichung neuer Versionen und Firmware-Zweige für NetApps Sorgen. Ja, einige Updates für Huawei erfordern weiterhin einen Neustart, aber nicht alle.
  5. 4 Huawei-Controller zum Preis von zwei NetApp-Controllern. Wie ich oben sagte, kann Huawei dank der Preispolitik mit seinen High-End-Modellen mit der Mittelklasse konkurrieren.
  6. Das Vorhandensein zusätzlicher Chips in Shelf-Controllern und Portkarten, die möglicherweise die Systemeffizienz verbessern sollen.

Nachteile und Bedenken im Allgemeinen:

  1. Direkter Anschluss von Regalen an Controller oder die Notwendigkeit einer großen Anzahl von Back-End-Ports, um alle Regale mit Controllern zu verbinden.
  2. ARM-Architektur und das Vorhandensein einer großen Anzahl von Chips – wie effizient wird sie funktionieren und wird die Leistung ausreichen?

Die meisten Bedenken und Befürchtungen können durch einen persönlichen Test der neuen Linie ausgeräumt werden. Ich hoffe, dass sie bald nach der Veröffentlichung in Moskau erscheinen und es genug davon gibt, um schnell eines für eigene Tests zu bekommen. Bisher können wir sagen, dass der Ansatz des Unternehmens insgesamt interessant aussieht und die neue Linie im Vergleich zu den Mitbewerbern sehr gut aussieht. Die endgültige Umsetzung wirft viele Fragen auf, denn Vieles werden wir erst Ende des Jahres und vielleicht erst 2020 sehen.

Source: habr.com

Kommentar hinzufügen