De klant wilde VDI. Ik heb echt gekeken naar de combinatie SimpliVity + VDI Citrix Virtual Desktop. Voor alle operators, stadskantoormedewerkers, enzovoort. Alleen al in de eerste migratiegolf waren er vijfduizend gebruikers, en daarom drongen zij aan op belastingtests. VDI kan beginnen te vertragen, hij kan rustig gaan liggen - en dit gebeurt niet altijd vanwege problemen met het kanaal. We kochten een zeer krachtig testpakket speciaal voor VDI en belastten de infrastructuur totdat deze te zwaar werd voor de schijven en de processor.
Voor geavanceerde VDI-tests hebben we dus een plastic fles en LoginVSI-software nodig. We hebben het met licenties voor 300 gebruikers. Vervolgens hebben we HPE SimpliVity 380-hardware in een pakket gestopt dat geschikt is voor de taak van maximale gebruikersdichtheid per server, virtuele machines met een goede overabonnement opgedeeld, kantoorsoftware op Win10 erop geïnstalleerd en begonnen met testen.
Systeem
Twee HPE SimpliVity 380 Gen10-nodes (servers). Op elke:
- 2 x Intel Xeon Platinum 8170 26c 2.1 GHz.
- RAM: 768 GB, 12 x 64 GB LRDIMM's DDR4 2666 MHz.
- Primaire schijfcontroller: HPE Smart Array P816i-a SR Gen10.
- Harde schijven: 9 x 1.92 TB SATA 6Gb/s SSD (in RAID6 7+2-configuratie, d.w.z. dit is een Medium-model in termen van HPE SimpliVity).
- Netwerkkaarten: 4 x 1Gb Eth (gebruikersgegevens), 2 x 10Gb Eth (SimpliVity en vMotion backend).
- Speciale ingebouwde FPGA-kaarten in elk knooppunt voor deduplicatie/compressie.
De knooppunten zijn rechtstreeks met elkaar verbonden via een 10Gb Ethernet-verbinding zonder externe switch, die wordt gebruikt als SimpliVity-backend en voor het overbrengen van virtuele machinegegevens via NFS. Gegevens van virtuele machines in een cluster worden altijd gespiegeld tussen twee knooppunten.
De knooppunten worden gecombineerd in een Vmware vSphere-cluster dat wordt beheerd door vCenter.
Voor het testen zijn een domeincontroller en een Citrix-verbindingsmakelaar ingezet. De domeincontroller, broker en vCenter worden op een apart cluster geplaatst.
Als testinfrastructuur werden 300 virtuele desktops ingezet in de Dedicated – Full Copy-configuratie, dat wil zeggen dat elke desktop een volledige kopie is van de originele afbeelding van de virtuele machine en alle door gebruikers aangebrachte wijzigingen opslaat.
Elke virtuele machine heeft 2vCPU en 4GB RAM:
De volgende software die nodig is voor het testen is op de virtuele machines geïnstalleerd:
- Windows 10 (64-bit), versie 1809.
- Adobe Reader XI.
- Citrix virtuele bezorgagent 1811.1.
- DoroPDF 1.82.
- Java7-update 13.
- Microsoft Office Professional Plus 2016.
Tussen knooppunten - synchrone replicatie. Elk gegevensblok in het cluster heeft twee exemplaren. Dat wil zeggen, nu is er een complete set gegevens op elk van de knooppunten. Bij een cluster van drie of meer knooppunten bevinden kopieën van blokken zich op twee verschillende plaatsen. Bij het maken van een nieuwe VM wordt er een extra kopie gemaakt op een van de clusterknooppunten. Wanneer één knooppunt uitvalt, worden alle VM's die er eerder op draaiden automatisch opnieuw opgestart op andere knooppunten waar ze replica's hebben. Als een knooppunt gedurende lange tijd uitvalt, begint het geleidelijke herstel van de redundantie en keert het cluster terug naar N+1-redundantie.
Gegevensbalancering en -opslag vindt plaats op het softwareopslagniveau van SimpliVity zelf.
Virtuele machines draaien een virtualisatiecluster, dat ze ook op softwareopslag plaatst. De bureaus zelf zijn volgens een standaardsjabloon ingenomen: de bureaus van financiers en operationeel functionarissen kwamen voor de test (dit zijn twee verschillende sjablonen).
Testen
Voor het testen werd gebruik gemaakt van de LoginVSI 4.1 softwaretestsuite. Het LoginVSI-complex, bestaande uit een controleserver en 12 machines voor testverbindingen, werd op een aparte fysieke host ingezet.
Er werd getest in drie modi:
Benchmarkmodus - belastinggevallen 300 Kenniswerkers en 300 Opslagwerkers.
Standaardmodus - belastinggeval 300 Krachtwerkers.
Om Power-werkers te laten werken en de diversiteit van de belasting te vergroten, is een bibliotheek met extra Power Library-bestanden toegevoegd aan het LoginVSI-complex. Om de herhaalbaarheid van de resultaten te garanderen, zijn alle testbankinstellingen op standaard gelaten.
De Knowledge and Power-werkerstests simuleren de werkelijke werklast van gebruikers die op virtuele werkstations werken.
De test voor opslagwerkers is speciaal gemaakt voor het testen van gegevensopslagsystemen; het is verre van echte werkbelasting en betreft meestal de gebruiker die werkt met een groot aantal bestanden van verschillende groottes.
Tijdens het testen loggen gebruikers gedurende 48 minuten in op werkstations, met een snelheid van ongeveer één gebruiker per 10 seconden.
Bevindingen
Het belangrijkste resultaat van de LoginVSI-testen is de VSImax-metriek, die wordt samengesteld op basis van de uitvoeringstijd van verschillende taken die door de gebruiker zijn gestart. Bijvoorbeeld: tijd om een bestand te openen in Kladblok, tijd om een bestand te comprimeren in 7-Zip, etc.
Een gedetailleerde beschrijving van de berekening van metrieken is beschikbaar in de officiële documentatie voor
Met andere woorden, LoginVSI herhaalt een typisch laadpatroon, simuleert gebruikersacties in een kantoorsuite, leest een PDF, enzovoort, en meet verschillende latenties. Er is een kritiek niveau van vertragingen “alles vertraagt, het is onmogelijk om te werken”), waarna wordt aangenomen dat het maximale aantal gebruikers niet is bereikt. Als de responstijd 1 ms sneller is dan deze “alles is langzaam”-status, wordt aangenomen dat het systeem normaal werkt en kunnen er meer gebruikers worden toegevoegd.
Dit zijn de belangrijkste statistieken:
Metrische gegevens
Ondernomen acties
gedetailleerd описание
Geladen componenten
N.S.L.D.
Openingstijd tekst
bestand met een gewicht van 1 KB
Kladblok wordt geopend en
opent een willekeurig document van 1 KB dat uit de pool wordt gekopieerd
middelen
CPU en I/O
NFO
Openingstijd dialoog
vensters in Kladblok
Een VSI-Kladblok-bestand openen [Ctrl+O]
CPU, RAM en I/O
ZHC*
Tijd om een sterk gecomprimeerd zip-bestand te maken
Lokale compressie
willekeurig 5MB PST-bestand gekopieerd
bronnenpool
CPU en I/O
ZLC*
Tijd om een zwak gecomprimeerd Zip-bestand te maken
Lokale compressie
willekeurig 5MB PST-bestand gekopieerd
bronnenpool
I / O
CPU
Groot rekenen
willekeurige gegevensarray
Een grote array maken
willekeurige gegevens die zullen worden gebruikt in de input/output-timer (I/O-timer)
CPU
Wanneer er tests worden uitgevoerd, wordt in eerste instantie de basis-VSIbase-metriek berekend, die de snelheid weergeeft waarmee taken worden uitgevoerd zonder belasting van het systeem. Op basis hiervan wordt de VSImax Threshold bepaald, die gelijk is aan VSIbase + 1 ms.
Er worden conclusies getrokken over de systeemprestaties op basis van twee meetgegevens: VSIbase, die de snelheid van het systeem bepaalt, en VSImax-drempel, die het maximale aantal gebruikers bepaalt dat het systeem aankan zonder significante verslechtering.
Benchmark 300 kenniswerkers
Kenniswerkers zijn gebruikers die regelmatig geheugen, processor en IO belasten met verschillende kleine pieken. De software emuleert de werkdruk van veeleisende kantoorgebruikers, alsof ze voortdurend ergens aan zitten te porren (PDF, Java, kantoorpakket, foto's bekijken, 7-Zip). Naarmate u gebruikers toevoegt van nul tot 300, neemt de vertraging voor elk gebruikers geleidelijk toe.
VSImax-statistische gegevens:
VSIbase = 986 ms, VSI-drempel is niet bereikt.
Laadstatistieken voor opslagsystemen van SimpliVity-monitoring:
Met dit type belasting is het systeem bestand tegen verhoogde belasting, zonder dat de prestaties achteruitgaan. De tijd die nodig is om gebruikerstaken uit te voeren neemt soepel toe, de systeemresponstijd verandert niet tijdens het testen en bedraagt maximaal 3 ms voor schrijven en maximaal 1 ms voor lezen.
Conclusie: 300 kennisgebruikers werken probleemloos op het huidige cluster en interfereren niet met elkaar, waardoor een pCPU/vCPU-overabonnement van 1 tot 6 wordt bereikt. De algehele vertragingen groeien gelijkmatig naarmate de belasting toeneemt, maar de gestelde limiet is niet bereikt.
Benchmark van 300 opslagmedewerkers
Dit zijn gebruikers die constant schrijven en lezen in een verhouding van respectievelijk 30 tot 70. Deze test werd meer uitgevoerd om te experimenteren. VSImax-statistische gegevens:
VSIbase = 1673, VSI-drempel bereikt op 240 gebruikers.
Laadstatistieken voor opslagsystemen van SimpliVity-monitoring:
Dit type belasting is in wezen een stresstest van het opslagsysteem. Wanneer het wordt uitgevoerd, schrijft elke gebruiker veel willekeurige bestanden van verschillende groottes naar schijf. In dit geval is te zien dat wanneer voor sommige gebruikers een bepaalde laaddrempel wordt overschreden, de tijd die nodig is om taken voor het schrijven van bestanden te voltooien, toeneemt. Tegelijkertijd verandert de belasting van het opslagsysteem, de processor en het geheugen van de hosts niet significant, waardoor het momenteel onmogelijk is om precies te bepalen wat de vertragingen veroorzaakt.
Conclusies over de systeemprestaties met behulp van deze test kunnen alleen worden getrokken in vergelijking met testresultaten op andere systemen, omdat dergelijke belastingen synthetisch en onrealistisch zijn. Over het algemeen verliep de test echter goed. Alles ging goed tot 210 sessies, en toen begonnen er vreemde reacties, die nergens werden bijgehouden behalve Login VSI.
300 krachtwerkers
Dit zijn gebruikers die houden van CPU, geheugen en hoge IO. Deze ‘powerusers’ voeren regelmatig complexe taken uit met lange tussenpozen, zoals het installeren van nieuwe software en het uitpakken van grote archieven. VSImax-statistische gegevens:
VSIbasis = 970, VSI-drempel is niet bereikt.
Laadstatistieken voor opslagsystemen van SimpliVity-monitoring:
Tijdens het testen werd de processorbelastingsdrempel bereikt op een van de systeemknooppunten, maar dit had geen significante invloed op de werking ervan:
In dit geval is het systeem bestand tegen verhoogde belasting zonder significante prestatievermindering. De tijd die nodig is om gebruikerstaken uit te voeren neemt soepel toe, de systeemresponstijd verandert niet tijdens het testen en bedraagt maximaal 3 ms voor schrijven en maximaal 1 ms voor lezen.
Regelmatige tests waren niet genoeg voor de klant en we gingen verder: we verhoogden de VM-kenmerken (aantal vCPU's om de toename van het overabonnement en de schijfgrootte te evalueren) en voegden extra belasting toe.
Bij het uitvoeren van aanvullende tests werd de volgende standconfiguratie gebruikt:
Er werden 300 virtuele desktops geïmplementeerd in een configuratie met 4 vCPU, 4 GB RAM en 80 GB HDD.
Configuratie van een van de testmachines:
De machines worden ingezet in de optie Dedicated – Full Copy:
300 Kenniswerkers benchmark met overinschrijving 12
VSImax-statistische gegevens:
VSIbasis = 921 ms, VSI-drempel is niet bereikt.
Laadstatistieken voor opslagsystemen van SimpliVity-monitoring:
De verkregen resultaten zijn vergelijkbaar met het testen van de vorige VM-configuratie.
300 Krachtwerkers met 12 overinschrijvingen
VSImax-statistische gegevens:
VSIbasis = 933, VSI-drempel is niet bereikt.
Laadstatistieken voor opslagsystemen van SimpliVity-monitoring:
Tijdens deze tests werd ook de belastingsdrempel van de processor bereikt, maar dit had geen significante invloed op de prestaties:
De verkregen resultaten zijn vergelijkbaar met het testen van de vorige configuratie.
Wat gebeurt er als u de belasting 10 uur laat draaien?
Laten we nu eens kijken of er een “accumulatie-effect” zal optreden en 10 uur achter elkaar tests uitvoeren.
De langetermijntesten en beschrijving van de sectie moesten erop gericht zijn om te controleren of er problemen zouden ontstaan met de truss als deze langdurig belast werd.
300 Kenniswerkers benchmark + 10 uur
Daarnaast werd een belastinggeval van 300 kenniswerkers getest, gevolgd door 10 uur gebruikerswerk.
VSImax-statistische gegevens:
VSIbasis = 919 ms, VSI-drempel is niet bereikt.
VSImax Gedetailleerde statistische gegevens:
Uit de grafiek blijkt dat er gedurende de gehele test geen prestatieverlies is waargenomen.
Laadstatistieken voor opslagsystemen van SimpliVity-monitoring:
De prestaties van het opslagsysteem blijven tijdens de test hetzelfde.
Aanvullende tests met toevoeging van synthetische belasting
De klant vroeg om een wilde lading aan de schijf toe te voegen. Om dit te doen is er een taak toegevoegd aan het opslagsysteem in elk van de virtuele machines van de gebruiker om een synthetische belasting op de schijf uit te voeren wanneer de gebruiker inlogt op het systeem. De belasting werd verzorgd door het fio-hulpprogramma, waarmee u de belasting van de schijf kunt beperken op basis van het aantal IOPS. Op elke machine werd een taak gelanceerd om een extra belasting te starten met een hoeveelheid van 22 IOPS 70%/30% Willekeurig lezen/schrijven.
300 Kenniswerkers benchmark + 22 IOPS per gebruiker
Bij de eerste tests bleek dat fio aanzienlijke CPU-overhead op virtuele machines oplegde. Dit leidde tot een snelle CPU-overbelasting van de hosts en had grote gevolgen voor de werking van het systeem als geheel.
Host-CPU-belasting:
Tegelijkertijd namen de vertragingen in het opslagsysteem natuurlijk ook toe:
Het gebrek aan rekenkracht werd kritiek rond 240 gebruikers:
Vanwege de verkregen resultaten werd besloten tests uit te voeren die minder CPU-intensief waren.
Benchmark voor 230 kantoormedewerkers + 22 IOPS per gebruiker
Om de belasting van de CPU te verminderen, is het belastingstype Kantoormedewerkers geselecteerd en zijn er ook 22 IOPS aan synthetische belasting aan elke sessie toegevoegd.
De test was beperkt tot 230 sessies om de maximale CPU-belasting niet te overschrijden.
De test werd uitgevoerd terwijl gebruikers tien uur lang hardliepen om de stabiliteit van het systeem te controleren tijdens langdurig gebruik bij bijna maximale belasting.
VSImax-statistische gegevens:
VSIbasis = 918 ms, VSI-drempel is niet bereikt.
VSImax Gedetailleerde statistische gegevens:
Uit de grafiek blijkt dat er gedurende de gehele test geen prestatieverlies is waargenomen.
Statistieken over CPU-belasting:
Bij het uitvoeren van deze test was de belasting van de CPU van de hosts bijna maximaal.
Laadstatistieken voor opslagsystemen van SimpliVity-monitoring:
De prestaties van het opslagsysteem blijven tijdens de test hetzelfde.
De belasting van het opslagsysteem tijdens de test bedroeg ongeveer 6 IOPS in een 500/60 verhouding (40 IOPS lezen, 3 IOPS schrijven), wat neerkomt op ongeveer 900 IOPS per werkstation.
De responstijd was gemiddeld 3 ms voor schrijven en maximaal 1 ms voor lezen.
Totaal
Bij het simuleren van echte belastingen op de HPE SimpliVity-infrastructuur werden resultaten verkregen die het vermogen van het systeem bevestigden om virtuele desktops van ten minste 300 Full Clone-machines op een paar SimpliVity-nodes te ondersteunen. Tegelijkertijd werd de responstijd van het opslagsysteem gedurende de gehele test op een optimaal niveau gehouden.
We zijn erg onder de indruk van de aanpak van lange tests en vergelijking van oplossingen vóór implementatie. Als u dat wenst, kunnen we ook de prestaties voor uw workloads testen. Inclusief andere hypergeconvergeerde oplossingen. De genoemde klant rondt nu parallel tests af op een andere oplossing. De huidige infrastructuur bestaat eenvoudigweg uit een vloot pc's, een domein en software op elke werkplek. Zonder tests overstappen op VDI is uiteraard behoorlijk lastig. Concreet is het moeilijk om de werkelijke mogelijkheden van een VDI-farm te begrijpen zonder echte gebruikers ernaar te migreren. En met deze tests kunt u snel de werkelijke mogelijkheden van een bepaald systeem evalueren zonder dat u daar gewone gebruikers bij hoeft te betrekken. Dit is waar deze studie vandaan kwam.
De tweede belangrijke aanpak is dat de klant meteen inzet voor een goede schaalvergroting. Hier kunt u een extra server kopen en een farm toevoegen, voor bijvoorbeeld 100 gebruikers is alles voorspelbaar tegen de gebruikersprijs. Als ze bijvoorbeeld 300 extra gebruikers moeten toevoegen, weten ze dat ze twee servers nodig hebben in een reeds gedefinieerde configuratie, in plaats van opnieuw te overwegen hun hele infrastructuur te upgraden.
De mogelijkheden van de HPE SimpliVity-federatie zijn interessant. Het bedrijf is geografisch gescheiden, dus het is zinvol om uw eigen afzonderlijke VDI-hardware in een verafgelegen kantoor te installeren. In de SimpliVity-federatie wordt elke virtuele machine gerepliceerd volgens een schema met de mogelijkheid om zeer snel en zonder belasting van het kanaal te repliceren tussen geografisch afgelegen clusters - dit is een ingebouwde back-up van een zeer goed niveau. Bij het repliceren van VM's tussen sites wordt het kanaal zo minimaal mogelijk gebruikt, en dit maakt het mogelijk om zeer interessante DR-architecturen te bouwen in de aanwezigheid van één enkel controlecentrum en een aantal gedecentraliseerde opslagsites.
Dit alles bij elkaar maakt het mogelijk om de financiële kant tot in detail te evalueren, de kosten van VDI bovenop de groeiplannen van het bedrijf te leggen en te begrijpen hoe snel de oplossing vruchten zal afwerpen en hoe deze zal werken. Omdat elke VDI een oplossing is die uiteindelijk veel hulpbronnen bespaart, maar tegelijkertijd hoogstwaarschijnlijk zonder de kosteneffectieve mogelijkheid om deze binnen 5-7 jaar na gebruik te veranderen.
Als u vragen heeft die niet voor commentaar bestemd zijn, kunt u mij in het algemeen per e-mail schrijven [e-mail beveiligd].
Bron: www.habr.com