So funktioniert HPE SimpliVity 380 für VDI: harte Belastungstests

So funktioniert HPE SimpliVity 380 für VDI: harte Belastungstests

Der Kunde wollte VDI. Ich habe mir die Kombination SimpliVity + VDI Citrix Virtual Desktop wirklich angesehen. Für alle Betreiber, Mitarbeiter des Stadtbüros usw. Allein in der ersten Migrationswelle gab es fünftausend Benutzer, und deshalb bestanden sie auf Auslastungstests. VDI kann langsamer werden, es kann sich ruhig hinlegen – und das geschieht nicht immer aufgrund von Problemen mit dem Kanal. Wir haben ein sehr leistungsfähiges Testpaket speziell für VDI gekauft und die Infrastruktur so lange geladen, bis sie die Festplatten und den Prozessor zu sehr belastete.

Für anspruchsvolle VDI-Tests benötigen wir also eine Plastikflasche und die LoginVSI-Software. Wir haben es mit Lizenzen für 300 Benutzer. Dann nahmen wir HPE SimpliVity 380-Hardware in einem für die Aufgabe der maximalen Benutzerdichte pro Server geeigneten Paket, zerschnitten virtuelle Maschinen mit guter Überzeichnung, installierten darauf Office-Software unter Win10 und begannen mit dem Testen.

Lassen Sie uns gehen!

System

Zwei HPE SimpliVity 380 Gen10-Knoten (Server). Auf jeder:

  • 2 x Intel Xeon Platinum 8170 26c 2.1 GHz.
  • RAM: 768 GB, 12 x 64 GB LRDIMMs DDR4 2666 MHz.
  • Primärer Festplattencontroller: HPE Smart Array P816i-a SR Gen10.
  • Festplatten: 9 x 1.92 TB SATA 6 Gb/s SSD (in RAID6 7+2-Konfiguration, d. h. dies ist ein mittleres Modell im Sinne von HPE SimpliVity).
  • Netzwerkkarten: 4 x 1 GB Eth (Benutzerdaten), 2 x 10 GB Eth (SimpliVity- und vMotion-Backend).
  • Spezielle integrierte FPGA-Karten in jedem Knoten für Deduplizierung/Komprimierung.

Die Knoten sind über eine 10-Gbit-Ethernet-Verbindung direkt ohne externen Switch miteinander verbunden, die als SimpliVity-Backend und zur Übertragung von Daten virtueller Maschinen über NFS verwendet wird. Daten virtueller Maschinen in einem Cluster werden immer zwischen zwei Knoten gespiegelt.

Die Knoten werden zu einem von vCenter verwalteten Vmware vSphere-Cluster zusammengefasst.

Zum Testen wurden ein Domänencontroller und ein Citrix-Verbindungsbroker bereitgestellt. Der Domänencontroller, Broker und vCenter werden auf einem separaten Cluster platziert.
So funktioniert HPE SimpliVity 380 für VDI: harte Belastungstests
So funktioniert HPE SimpliVity 380 für VDI: harte Belastungstests
Als Testinfrastruktur wurden 300 virtuelle Desktops in der Konfiguration „Dedicated – Full Copy“ bereitgestellt, d. h. jeder Desktop ist eine vollständige Kopie des Original-Images der virtuellen Maschine und speichert alle von Benutzern vorgenommenen Änderungen.

Jede virtuelle Maschine verfügt über 2vCPU und 4GB RAM:

So funktioniert HPE SimpliVity 380 für VDI: harte Belastungstests

So funktioniert HPE SimpliVity 380 für VDI: harte Belastungstests

Auf den virtuellen Maschinen wurde die folgende zum Testen erforderliche Software installiert:

  • Windows 10 (64-Bit), Version 1809.
  • Adobe Reader XI.
  • Citrix Virtual Delivery Agent 1811.1.
  • Doro PDF 1.82.
  • Java 7 Update 13.
  • Microsoft Office Professional Plus 2016.

Zwischen Knoten – synchrone Replikation. Jeder Datenblock im Cluster hat zwei Kopien. Das heißt, jetzt liegt auf jedem Knoten ein vollständiger Datensatz vor. Bei einem Cluster aus drei oder mehr Knoten befinden sich Kopien von Blöcken an zwei verschiedenen Orten. Beim Erstellen einer neuen VM wird eine zusätzliche Kopie auf einem der Clusterknoten erstellt. Wenn ein Knoten ausfällt, werden alle zuvor darauf ausgeführten VMs automatisch auf anderen Knoten neu gestartet, auf denen sie über Replikate verfügen. Wenn ein Knoten über einen längeren Zeitraum ausfällt, beginnt die schrittweise Wiederherstellung der Redundanz und der Cluster kehrt zur N+1-Redundanz zurück.

Der Datenausgleich und die Datenspeicherung erfolgen auf der Softwarespeicherebene von SimpliVity selbst.

Virtuelle Maschinen führen einen Virtualisierungscluster aus, der sie auch auf dem Softwarespeicher ablegt. Die Schreibtische selbst wurden nach einer Standardvorlage erstellt: Zur Prüfung kamen die Schreibtische von Finanziers und Betriebsleitern (das sind zwei verschiedene Vorlagen).

Testing

Zum Testen wurde die Software-Testsuite LoginVSI 4.1 verwendet. Der LoginVSI-Komplex, bestehend aus einem Kontrollserver und 12 Maschinen für Testverbindungen, wurde auf einem separaten physischen Host bereitgestellt.
So funktioniert HPE SimpliVity 380 für VDI: harte Belastungstests

Die Tests wurden in drei Modi durchgeführt:

Benchmark-Modus – Lastfälle 300 Wissensarbeiter und 300 Speicherarbeiter.

Standardmodus - Lastfall 300 Kraftarbeiter.

Um Power-Workern die Arbeit zu ermöglichen und die Lastvielfalt zu erhöhen, wurde dem LoginVSI-Komplex eine Bibliothek mit zusätzlichen Power-Bibliotheksdateien hinzugefügt. Um die Wiederholbarkeit der Ergebnisse sicherzustellen, wurden alle Prüfstandseinstellungen auf den Standardeinstellungen belassen.

Die Knowledge- und Power-Worker-Tests simulieren die reale Arbeitsbelastung von Benutzern, die an virtuellen Arbeitsplätzen arbeiten.

Der Storage-Worker-Test wurde speziell zum Testen von Datenspeichersystemen entwickelt; er ist weit von echten Arbeitslasten entfernt und erfordert hauptsächlich, dass der Benutzer mit einer großen Anzahl von Dateien unterschiedlicher Größe arbeitet.

Während des Tests melden sich Benutzer 48 Minuten lang bei Workstations an, wobei sich etwa alle 10 Sekunden ein Benutzer einloggt.

Ergebnisse

Das Hauptergebnis des LoginVSI-Tests ist die VSImax-Metrik, die aus der Ausführungszeit verschiedener vom Benutzer gestarteter Aufgaben zusammengestellt wird. Zum Beispiel: Zeit zum Öffnen einer Datei im Notepad, Zeit zum Komprimieren einer Datei in 7-Zip usw.

Eine detaillierte Beschreibung der Metrikberechnung finden Sie in der offiziellen Dokumentation für Link.

Mit anderen Worten: LoginVSI wiederholt ein typisches Lademuster, simuliert Benutzeraktionen in einer Office-Suite, das Lesen einer PDF-Datei usw. und misst verschiedene Latenzen. Es gibt ein kritisches Verzögerungsniveau „Alles wird langsamer, es ist unmöglich zu arbeiten“), bei dem davon ausgegangen wird, dass die maximale Benutzerzahl nicht erreicht wurde. Wenn die Reaktionszeit 1 ms schneller ist als dieser „Alles ist langsam“-Zustand, wird davon ausgegangen, dass das System normal funktioniert, und es können weitere Benutzer hinzugefügt werden.

Hier sind die wichtigsten Kennzahlen:

Metriken

Durchgeführte Aktionen

Detailliert описание

Geladene Komponenten

N.S.L.D.

Textöffnungszeit
Datei mit einem Gewicht von 1 KB

Der Editor wird geöffnet und
öffnet ein zufälliges 1-KB-Dokument, das aus dem Pool kopiert wird
ресурсов

CPU und I/O

NFO

Eröffnungszeit des Dialogs
Fenster im Notizblock

Öffnen einer VSI-Notepad-Datei [Strg+O]

CPU, RAM und I/O

 

ZHC*

Zeit, eine hochkomprimierte Zip-Datei zu erstellen

Lokale Komprimierung
Zufällige 5 MB große PST-Datei, aus der kopiert wurde
Ressourcenpool

CPU und I/O

ZLC*

Zeit, eine schwach komprimierte Zip-Datei zu erstellen

Lokale Komprimierung
Zufällige 5 MB große PST-Datei, aus der kopiert wurde
Ressourcenpool

I / O

 

CPU

Groß rechnen
zufälliges Datenarray

Erstellen eines großen Arrays
Zufallsdaten, die im Ein-/Ausgabe-Timer (I/O-Timer) verwendet werden.

CPU

Beim Testen wird zunächst die grundlegende VSIbase-Metrik berechnet, die die Geschwindigkeit angibt, mit der Jobs ohne Belastung des Systems ausgeführt werden. Auf dieser Grundlage wird der VSImax-Schwellenwert bestimmt, der VSIbase + 1 ms entspricht.

Rückschlüsse auf die Systemleistung werden auf der Grundlage von zwei Metriken gezogen: VSIbase, das die Geschwindigkeit des Systems bestimmt, und VSImax-Schwellenwert, der die maximale Anzahl von Benutzern bestimmt, die das System ohne wesentliche Verschlechterung verarbeiten kann.

300 Wissensarbeiter-Benchmark

Wissensarbeiter sind Benutzer, die Speicher, Prozessor und E/A regelmäßig mit verschiedenen kleinen Spitzen belasten. Die Software ahmt die Arbeitsbelastung anspruchsvoller Office-Anwender nach, als ob sie ständig in etwas herumstochern würden (PDF, Java, Office-Suite, Fotobetrachtung, 7-Zip). Wenn Sie Benutzer von null bis 300 hinzufügen, erhöht sich die Verzögerung für jeden einzelnen schrittweise.

VSImax-Statistikdaten:
So funktioniert HPE SimpliVity 380 für VDI: harte Belastungstests
VSIbase = 986 ms, VSI-Schwellenwert wurde nicht erreicht.

Statistiken zur Speichersystemauslastung aus der SimpliVity-Überwachung:
So funktioniert HPE SimpliVity 380 für VDI: harte Belastungstests

Bei dieser Art von Belastung kann das System einer erhöhten Belastung praktisch ohne Leistungseinbußen standhalten. Die Zeit, die zum Erledigen von Benutzeraufgaben benötigt wird, erhöht sich stufenlos, die Reaktionszeit des Systems ändert sich während des Tests nicht und beträgt bis zu 3 ms beim Schreiben und bis zu 1 ms beim Lesen.

Fazit: 300 Knowledge-Benutzer arbeiten problemlos am aktuellen Cluster und stören sich nicht gegenseitig, wodurch eine pCPU/vCPU-Überbelegung von 1 bis 6 erreicht wird. Die Gesamtverzögerungen nehmen mit zunehmender Last gleichmäßig zu, das festgelegte Limit wurde jedoch nicht erreicht.

300 Storage-Worker-Benchmark

Dabei handelt es sich um Nutzer, die ständig im Verhältnis 30 zu 70 schreiben und lesen. Dieser Test wurde eher zum Zwecke des Experimentierens durchgeführt. VSImax-Statistikdaten:
So funktioniert HPE SimpliVity 380 für VDI: harte Belastungstests

VSIbase = 1673, VSI-Schwellenwert bei 240 Benutzern erreicht.

Statistiken zur Speichersystemauslastung aus der SimpliVity-Überwachung:
So funktioniert HPE SimpliVity 380 für VDI: harte Belastungstests
Bei dieser Art von Belastung handelt es sich im Wesentlichen um einen Stresstest des Speichersystems. Bei der Ausführung schreibt jeder Benutzer viele zufällige Dateien unterschiedlicher Größe auf die Festplatte. In diesem Fall ist zu erkennen, dass bei Überschreiten einer bestimmten Lastschwelle für einige Benutzer die Zeit für die Erledigung von Aufgaben zum Schreiben von Dateien zunimmt. Gleichzeitig ändert sich die Belastung des Speichersystems, des Prozessors und des Arbeitsspeichers der Hosts nicht wesentlich, sodass derzeit nicht genau ermittelt werden kann, was die Verzögerungen verursacht.

Rückschlüsse auf die Systemleistung können mit diesem Test nur im Vergleich mit Testergebnissen auf anderen Systemen gezogen werden, da solche Belastungen synthetisch und unrealistisch sind. Insgesamt verlief der Test jedoch gut. Bis zu 210 Sitzungen lief alles gut, und dann begannen seltsame Reaktionen, die nirgendwo außer Login VSI verfolgt wurden.

300 Power-Arbeiter

Dies sind Benutzer, die CPU, Speicher und hohe IOs lieben. Diese „Power-User“ führen regelmäßig komplexe Aufgaben in langen Abständen aus, etwa die Installation neuer Software und das Entpacken großer Archive. VSImax-Statistikdaten:
So funktioniert HPE SimpliVity 380 für VDI: harte Belastungstests

VSIbase = 970, VSI-Schwellenwert wurde nicht erreicht.

Statistiken zur Speichersystemauslastung aus der SimpliVity-Überwachung:
So funktioniert HPE SimpliVity 380 für VDI: harte Belastungstests

Während des Tests wurde auf einem der Systemknoten die Prozessorauslastungsschwelle erreicht, dies hatte jedoch keine wesentlichen Auswirkungen auf den Betrieb:

So funktioniert HPE SimpliVity 380 für VDI: harte Belastungstests

So funktioniert HPE SimpliVity 380 für VDI: harte Belastungstests

In diesem Fall kann das System einer erhöhten Belastung ohne nennenswerte Leistungseinbußen standhalten. Die Zeit, die zum Erledigen von Benutzeraufgaben benötigt wird, erhöht sich stufenlos, die Reaktionszeit des Systems ändert sich während des Tests nicht und beträgt bis zu 3 ms beim Schreiben und bis zu 1 ms beim Lesen.

Regelmäßige Tests reichten dem Kunden nicht aus, und wir gingen noch einen Schritt weiter: Wir erhöhten die VM-Eigenschaften (Anzahl der vCPUs zur Bewertung des Anstiegs der Überbelegung und der Festplattengröße) und fügten zusätzliche Last hinzu.

Bei der Durchführung zusätzlicher Tests wurde folgende Standkonfiguration verwendet:
300 virtuelle Desktops wurden in einer Konfiguration mit 4 vCPU, 4 GB RAM und 80 GB HDD bereitgestellt.

Konfiguration einer der Testmaschinen:
So funktioniert HPE SimpliVity 380 für VDI: harte Belastungstests

Die Maschinen werden in der Option „Dediziert – Vollständige Kopie“ bereitgestellt:

So funktioniert HPE SimpliVity 380 für VDI: harte Belastungstests

So funktioniert HPE SimpliVity 380 für VDI: harte Belastungstests

300 Wissensarbeiter-Benchmark mit Überzeichnung 12

VSImax-Statistikdaten:
So funktioniert HPE SimpliVity 380 für VDI: harte Belastungstests

VSIbase = 921 ms, VSI-Schwellenwert wurde nicht erreicht.

Statistiken zur Speichersystemauslastung aus der SimpliVity-Überwachung:
So funktioniert HPE SimpliVity 380 für VDI: harte Belastungstests

Die erhaltenen Ergebnisse ähneln denen beim Testen der vorherigen VM-Konfiguration.

300 Power-Mitarbeiter mit 12 Überzeichnungen

VSImax-Statistikdaten:
So funktioniert HPE SimpliVity 380 für VDI: harte Belastungstests

VSIbase = 933, VSI-Schwellenwert wurde nicht erreicht.

Statistiken zur Speichersystemauslastung aus der SimpliVity-Überwachung:
So funktioniert HPE SimpliVity 380 für VDI: harte Belastungstests

Bei diesem Test wurde auch die Prozessorauslastungsschwelle erreicht, was jedoch keine nennenswerten Auswirkungen auf die Leistung hatte:

So funktioniert HPE SimpliVity 380 für VDI: harte Belastungstests

So funktioniert HPE SimpliVity 380 für VDI: harte Belastungstests

Die erhaltenen Ergebnisse ähneln denen beim Testen der vorherigen Konfiguration.

Was passiert, wenn Sie die Last 10 Stunden lang laufen lassen?

Schauen wir nun, ob es zu einem „Akkumulationseffekt“ kommt und führen wir die Tests 10 Stunden hintereinander durch.

Die Langzeittests und die Beschreibung des Abschnitts sollten darauf abzielen, dass wir prüfen wollten, ob es bei langfristiger Belastung des Fachwerks zu Problemen kommen würde.

300 Wissensarbeiter-Benchmark + 10 Stunden

Zusätzlich wurde ein Lastfall von 300 Wissensarbeitern getestet, gefolgt von einer Benutzerarbeit für 10 Stunden.

VSImax-Statistikdaten:
So funktioniert HPE SimpliVity 380 für VDI: harte Belastungstests

VSIbase = 919 ms, VSI-Schwellenwert wurde nicht erreicht.

VSImax Detaillierte Statistikdaten:
So funktioniert HPE SimpliVity 380 für VDI: harte Belastungstests

Die Grafik zeigt, dass während des gesamten Tests keine Leistungseinbußen beobachtet wurden.

Statistiken zur Speichersystemauslastung aus der SimpliVity-Überwachung:
So funktioniert HPE SimpliVity 380 für VDI: harte Belastungstests

Die Leistung des Speichersystems bleibt während des gesamten Tests gleich.

Zusätzliche Prüfung mit zusätzlicher synthetischer Belastung

Der Kunde bat darum, der Festplatte eine wilde Ladung hinzuzufügen. Zu diesem Zweck wurde dem Speichersystem in jeder virtuellen Maschine des Benutzers eine Aufgabe hinzugefügt, um eine synthetische Last auf der Festplatte auszuführen, wenn sich der Benutzer am System anmeldet. Die Last wurde vom Dienstprogramm fio bereitgestellt, mit dem Sie die Last auf der Festplatte durch die Anzahl der IOPS begrenzen können. Auf jeder Maschine wurde eine Aufgabe gestartet, um eine zusätzliche Last in Höhe von 22 IOPS 70 %/30 % zufälliges Lesen/Schreiben zu starten.

300 Wissensarbeiter-Benchmark + 22 IOPS pro Benutzer

In ersten Tests wurde festgestellt, dass FIO den virtuellen Maschinen einen erheblichen CPU-Overhead verursacht. Dies führte zu einer schnellen CPU-Überlastung der Hosts und beeinträchtigte den Betrieb des Gesamtsystems erheblich.

Host-CPU-Last:
So funktioniert HPE SimpliVity 380 für VDI: harte Belastungstests

So funktioniert HPE SimpliVity 380 für VDI: harte Belastungstests

Gleichzeitig nahmen natürlich auch die Verzögerungen im Speichersystem zu:
So funktioniert HPE SimpliVity 380 für VDI: harte Belastungstests

Der Mangel an Rechenleistung wurde bei rund 240 Nutzern kritisch:
So funktioniert HPE SimpliVity 380 für VDI: harte Belastungstests

Aufgrund der erzielten Ergebnisse wurde beschlossen, Tests durchzuführen, die weniger CPU-intensiv sind.

230 Büroangestellte Benchmark + 22 IOPS pro Benutzer

Um die Belastung der CPU zu reduzieren, wurde der Lasttyp „Büroarbeiter“ ausgewählt und jeder Sitzung wurden außerdem 22 IOPS synthetischer Last hinzugefügt.

Der Test wurde auf 230 Sitzungen begrenzt, um die maximale CPU-Last nicht zu überschreiten.

Der Test wurde mit einem 10-stündigen Betrieb durchgeführt, um die Stabilität des Systems im Langzeitbetrieb nahe der Maximallast zu überprüfen.

VSImax-Statistikdaten:
So funktioniert HPE SimpliVity 380 für VDI: harte Belastungstests

VSIbase = 918 ms, VSI-Schwellenwert wurde nicht erreicht.

VSImax Detaillierte Statistikdaten:
So funktioniert HPE SimpliVity 380 für VDI: harte Belastungstests

Die Grafik zeigt, dass während des gesamten Tests keine Leistungseinbußen beobachtet wurden.

CPU-Auslastungsstatistik:
So funktioniert HPE SimpliVity 380 für VDI: harte Belastungstests

So funktioniert HPE SimpliVity 380 für VDI: harte Belastungstests

Bei diesem Test war die Belastung der CPU der Hosts nahezu maximal.

Statistiken zur Speichersystemauslastung aus der SimpliVity-Überwachung:
So funktioniert HPE SimpliVity 380 für VDI: harte Belastungstests

Die Leistung des Speichersystems bleibt während des gesamten Tests gleich.

Die Belastung des Speichersystems betrug während des Tests etwa 6 IOPS im Verhältnis 500/60 (40 IOPS Lesen, 3 IOPS Schreiben), was etwa 900 IOPS pro Workstation entspricht.

Die Reaktionszeit betrug durchschnittlich 3 ms beim Schreiben und bis zu 1 ms beim Lesen.

Ergebnis

Bei der Simulation realer Belastungen der HPE SimpliVity-Infrastruktur wurden Ergebnisse erzielt, die die Fähigkeit des Systems bestätigen, virtuelle Desktops von mindestens 300 Full Clone-Maschinen auf einem Paar SimpliVity-Knoten zu unterstützen. Gleichzeitig wurde die Reaktionszeit des Speichersystems während des gesamten Tests auf einem optimalen Niveau gehalten.

Wir sind sehr beeindruckt von dem Ansatz, Lösungen vor der Implementierung ausgiebig zu testen und zu vergleichen. Auf Wunsch können wir auch die Leistung Ihrer Workloads testen. Einschließlich anderer hyperkonvergenter Lösungen. Der genannte Kunde beendet derzeit parallel die Tests einer anderen Lösung. Die aktuelle Infrastruktur besteht lediglich aus einer Flotte von PCs, einer Domäne und Software an jedem Arbeitsplatz. Der Umstieg auf VDI ohne Tests ist natürlich ziemlich schwierig. Insbesondere ist es schwierig, die tatsächlichen Fähigkeiten einer VDI-Farm zu verstehen, ohne echte Benutzer dorthin zu migrieren. Und diese Tests ermöglichen es Ihnen, die tatsächlichen Fähigkeiten eines bestimmten Systems schnell zu bewerten, ohne dass normale Benutzer einbezogen werden müssen. Daher entstand diese Studie.

Der zweite wichtige Ansatz besteht darin, dass sich der Kunde sofort zur richtigen Skalierung verpflichtet. Hier können Sie einen zusätzlichen Server kaufen und eine Farm hinzufügen, beispielsweise für 100 Benutzer, alles ist zum Benutzerpreis kalkulierbar. Wenn sie beispielsweise 300 weitere Benutzer hinzufügen müssen, wissen sie, dass sie zwei Server in einer bereits definierten Konfiguration benötigen, anstatt die Aktualisierung ihrer gesamten Infrastruktur noch einmal zu überdenken.

Interessant sind die Möglichkeiten der HPE SimpliVity Federation. Das Unternehmen ist geografisch getrennt, daher ist es sinnvoll, Ihre eigene separate VDI-Hardware in einem entfernten Büro zu installieren. In der SimpliVity-Föderation wird jede virtuelle Maschine nach einem Zeitplan repliziert, mit der Möglichkeit, sehr schnell und ohne Belastung des Kanals zwischen geografisch entfernten Clustern zu replizieren – dies ist ein integriertes Backup auf sehr gutem Niveau. Bei der Replikation von VMs zwischen Standorten wird der Kanal so gering wie möglich genutzt, was den Aufbau sehr interessanter DR-Architekturen mit einem einzigen Kontrollzentrum und einer Reihe dezentraler Speicherstandorte ermöglicht.
So funktioniert HPE SimpliVity 380 für VDI: harte Belastungstests
Föderation

All dies zusammen ermöglicht es, die finanzielle Seite sehr detailliert zu bewerten, die Kosten von VDI mit den Wachstumsplänen des Unternehmens zu überlagern und zu verstehen, wie schnell sich die Lösung auszahlt und wie sie funktioniert. Denn jede VDI ist eine Lösung, die letztendlich viele Ressourcen spart, gleichzeitig aber höchstwahrscheinlich keine kostengünstige Möglichkeit bietet, sie innerhalb von 5-7 Jahren nach der Nutzung zu ändern.

Wenn Sie Fragen haben, die nicht kommentiert werden können, schreiben Sie mir im Allgemeinen eine E-Mail [E-Mail geschützt] .

Source: habr.com

Kommentar hinzufügen