Analisi di prestazioni di VM in VMware vSphere. Parte 3: Storage

Analisi di prestazioni di VM in VMware vSphere. Parte 3: Storage

Part 1. Circa u CPU
Part 2. About Memory

Oghje avemu da analizà e metriche di u sottosistema di discu in vSphere. Un prublema di almacenamiento hè u mutivu più cumuni per una macchina virtuale lenta. Se, in u casu di CPU è RAM, a risoluzione di prublemi finisci à u livellu di l'ipervisore, allora s'ellu ci sò prublemi cù u discu, pudete avè da trattà cù a rete di dati è u sistema di almacenamento.

Discuteraghju di u tema cù l'esempiu di l'accessu di bloccu à i sistemi di almacenamiento, anche se per l'accessu à i schedari i cuntatori sò apprussimatamente listessi.

Un pocu di tiurìa

Quandu si parla di u funziunamentu di u sottosistema di discu di e macchine virtuali, a ghjente generalmente presta attenzione à trè paràmetri interrelati:

  • numeru di operazioni di input / output (Operazioni Input / Output Per Second, IOPS);
  • trasferimentu;
  • ritardu di l'operazioni di input/output (Latenza).

Numero di IOPS di solitu impurtante per carichi di travagliu casuale: accessu à i blocchi di discu situati in diversi lochi. Un esempiu di tali carica pò esse basa di dati, applicazioni cummerciale (ERP, CRM), etc.

Banda larga impurtante per carichi sequenziali: accessu à i blocchi situati unu dopu à l'altru. Per esempiu, i servitori di schedari (ma micca sempre) è i sistemi di sorveglianza video ponu generà una tale carica.

A produzzione hè ligata à u numeru di operazioni I/O cum'è seguente:

Rendimentu = IOPS * Dimensione di u bloccu, induve Block size hè a dimensione di bloccu.

A dimensione di u bloccu hè una caratteristica abbastanza impurtante. E versioni muderni di ESXi permettenu blocchi finu à 32 KB in grandezza. Se u blocu hè ancu più grande, hè divisu in parechji. Micca tutti i sistemi di almacenamentu ponu travaglià in modu efficiente cù blocchi cusì grande, cusì ci hè un paràmetru DiskMaxIOSize in ESXi Advanced Settings. Utilizendu, pudete riduce a dimensione massima di bloccu saltata da l'ipervisore (più dettagli ccà). Prima di cambià stu paràmetru, vi ricumandemu di cunsultà cù u fabricatore di u sistema di almacenamentu o almenu pruvà i cambiamenti nantu à un bancu di laboratoriu. 

Una grande dimensione di bloccu pò avè un effettu preghjudiziu nantu à u rendiment di almacenamento. Ancu s'è u nùmeru di IOPS è u throughput sò relativamente chjuchi, latenzi elevati ponu esse osservati cù una grandezza di bloccu grande. Dunque, fate attenzione à stu paràmetru.

Latenza - u paràmetru di rendiment più interessante. A latenza I/O per una macchina virtuale hè custituita da:

  • ritardi in l'hypervisor (KAVG, Average Kernel MilliSec/Read);
  • ritardu furnitu da a rete di dati è u sistema di almacenamiento (DAVG, Average Driver MilliSec/Command).

A latenza tutale chì hè visibile in u SO invitatu (GAVG, Media Guest MilliSec / Command) hè a somma di KAVG è DAVG.

GAVG è DAVG sò misurati è KAVG hè calculatu: GAVG-DAVG.

Analisi di prestazioni di VM in VMware vSphere. Parte 3: Storage
Source

Fighjemu un ochju più vicinu KAVG. Durante u funziunamentu normale, KAVG deve tende à cero o almenu esse assai menu di DAVG. L'unicu casu chì cunnoscu induve KAVG hè previstu altu hè u limitu IOPS in u discu VM. In questu casu, quandu pruvate à superà u limitu, KAVG aumenterà.

U cumpunente più significativu di KAVG hè QAVG - u tempu di fila di trasfurmazioni in l'hypervisor. I cumpunenti rimanenti di KAVG sò insignificanti.

A fila in u driver di l'adattatore di discu è a fila à e lune hà una dimensione fissa. Per ambienti assai carichi, pò esse utile per aumentà sta dimensione. descrive cumu cresce a fila in u driver di l'adattatore (à u stessu tempu a fila à e lune aumenta). Stu paràmetru funziona quandu una sola VM travaglia cù a luna, chì hè raru. Se ci sò parechje VM nantu à a luna, deve ancu aumentà u paràmetru Disk.SchedNumReqOutstanding (istruzzioni  ccà). Aumentendu a fila, diminuite QAVG è KAVG rispettivamente.

Ma dinò, prima leghje a documentazione da u vinditore HBA è pruvate i cambiamenti nantu à un bancu di labburatoriu.

A dimensione di a fila à a luna pò esse affettata da l'inclusione di u mecanismu SIOC (Storage I/O Control). Offre un accessu uniforme à a luna da tutti i servitori in u cluster cambiendu dinamicamente a fila à a luna nantu à i servitori. Questu hè, se unu di l'ospiti esegue una VM chì richiede una quantità sproporzionata di prestazione (VM rumoroso vicinu), SIOC riduce a lunghezza di a fila à a luna nantu à questu host (DQLEN). Più dettagli ccà.

Avemu risoltu KAVG, avà un pocu circa DAVG. Tuttu hè simplice quì: DAVG hè u ritardu introduttu da l'ambiente esternu (rete di dati è sistema di almacenamiento). Ogni sistema di almacenamentu mudernu è micca cusì mudernu hà u so propiu contatore di rendiment. Per analizà i prublemi cù DAVG, hè sensu di fighjà. Sè tuttu hè bè in u latu ESXi è almacenamiento, verificate a reta di dati.

Per evità i prublemi di rendiment, sceglite a Politica di Selezzione di Path (PSP) curretta per u vostru sistema di almacenamento. Quasi tutti i sistemi di almacenamentu muderni supportanu PSP Round-Robin (cù o senza ALUA, Access Logical Unit Asymmetric). Sta pulitica permette di utilizà tutti i camini dispunibuli à u sistema di almacenamiento. In u casu di ALUA, solu i camini à u controller chì pussede a luna sò usati. Micca tutti i sistemi di almacenamento in ESXi anu regule predeterminate chì stabiliscenu a pulitica Round-Robin. Se ùn ci hè micca una regula per u vostru sistema di almacenamento, utilizate un plugin da u fabricatore di u sistema di almacenamento, chì creà una regula currispundente in tutti l'ospiti in u cluster, o creanu una regula sè stessu. Dettagli ccà

Inoltre, certi pruduttori di u sistema di almacenamentu ricumandemu di cambià u numeru di IOPS per percorsu da u valore standard di 1000 à 1. In a nostra pratica, questu hà permessu di "squeeze" più prestazione fora di u sistema di almacenamiento è riduce significativamente u tempu necessariu per fallu. in casu di fallimentu o aghjurnamentu di u controller. Verificate i cunsiglii di u venditore, è se ùn ci sò micca contraindicazioni, pruvate à cambià stu paràmetru. Dettagli ccà.

Contatori di prestazione di u sottosistema di discu di a macchina virtuale di basa

I contatori di prestazione di u sottosistema di discu in vCenter sò recullati in e sezioni Datastore, Disk, Virtual Disk:

Analisi di prestazioni di VM in VMware vSphere. Parte 3: Storage

rùbbrica magazzinu di dati ci sò metriche per i magazzini di discu vSphere (magazzini di dati) in quale si trovanu i dischi VM. Quì truverete i contatori standard per:

  • IOPS (Media di richieste di lettura / scrittura per seconda), 
  • throughput (tassu di lettura / scrittura), 
  • ritardu (Lettura / Scrittura / Latenza più alta).

In principiu, tuttu hè chjaru da i nomi di i contatori. Lasciami attirà a vostra attenzione una volta à u fattu chì e statistiche quì ùn sò micca per una VM specifica (o discu VM), ma statistiche generale per tuttu u datastore. In u mo parè, hè più cunvenutu per vede queste statistiche in ESXTOP, almenu basatu annantu à u fattu chì u periodu minimu di misurazione hè 2 seconde.

rùbbrica u discu ci sò metriche nantu à i dispositi di blocu chì sò utilizati da a VM. Ci sò cuntatori per IOPS di u tipu di summation (u nùmeru di operazioni di input/output durante u periodu di misurazione) è parechji cuntatori ligati à l'accessu di bloccu (Cumandamenti annullati, Bus reset). In u mo parè, hè ancu più cunvene per vede sta infurmazione in ESXTOP.

Sezione U discu virtuale - u più utile da u puntu di vista di truvà prublemi di prestazione di u sottosistema di discu VM. Quì pudete vede u rendiment per ogni discu virtuale. Hè sta infurmazione chì hè necessariu per capisce se una macchina virtuale particulare hà un prublema. In più di i cuntatori standard per u numeru di operazioni I/O, volumi di lettura/scrittura è ritardi, sta sezione cuntene contatori utili chì mostranu a dimensione di u bloccu: Lettura/Scrittura di a dumanda.

In a stampa sottu hè un graficu di u rendiment di u discu VM, induve pudete vede u numeru di IOPS, latenza è taglia di bloccu. 

Analisi di prestazioni di VM in VMware vSphere. Parte 3: Storage

Pudete ancu vede e metriche di rendiment per tuttu u datastore se SIOC hè attivatu. Eccu l'infurmazioni basi nantu à a Latenza media è IOPS. Per automaticamente, sta infurmazione pò esse vista solu in tempu reale.

Analisi di prestazioni di VM in VMware vSphere. Parte 3: Storage

ESXTOP

ESXTOP hà parechje schermi chì furniscenu infurmazioni nantu à u sottosistema di discu di l'ospite in tuttu, e macchine virtuali individuali è i so dischi.

Cuminciamu cù l'infurmazioni nantu à e macchine virtuali. U screnu "Disk VM" hè chjamatu cù a chjave "v":

Analisi di prestazioni di VM in VMware vSphere. Parte 3: Storage

NVDISK hè u numeru di dischi VM. Per vede l'infurmazioni per ogni discu, premete "e" è inserite u GID di a VM d'interessu.

U significatu di i paràmetri rimanenti nantu à sta schermu hè chjaru da i so nomi.

Un altru schermu utile per a risoluzione di i prublemi hè l'adattatore di discu. Chjamatu da a chjave "d" (i campi A,B,C,D,E,G sò scelti in a stampa sottu):

Analisi di prestazioni di VM in VMware vSphere. Parte 3: Storage

NPTH - u numeru di camini à e lune chì sò visibili da questu adattatore. Per uttene infurmazione per ogni percorsu nantu à l'adattatore, pressu "e" è inserite u nome di l'adattatore:

Analisi di prestazioni di VM in VMware vSphere. Parte 3: Storage

AQLEN - dimensione massima di a fila nantu à l'adattatore.

Ancu in questa schermu sò i contatori di ritardu chì aghju parlatu sopra: KAVG/cmd, GAVG/cmd, DAVG/cmd, QAVG/cmd.

A schermu di u dispusitivu Disk, chì hè chjamatu pressu a chjave "u", furnisce infurmazioni nantu à i dispositi blocchi individuali - lune (campi A, B, F, G, I sò scelti in a stampa sottu). Quì pudete vede u statutu di a fila per e lune.

Analisi di prestazioni di VM in VMware vSphere. Parte 3: Storage

DQLEN - dimensione di fila per un dispositivu di bloccu.
ACTV - numeru di cumandamenti I/O in u kernel ESXi.
QUED - numeru di cumandamenti I/O in a fila.
%USD - ACTV / DQLEN × 100%.
LOAD – (ACTV + QUED) / DQLEN.

Se %USD hè altu, duvete cunsiderà aumentà a fila. Più cumandamenti in a fila, più altu u QAVG è, per quessa, u KAVG.

Pudete ancu vede nantu à a pantalla di u dispositivu Disk se VAAI (vStorage API for Array Integration) hè in esecuzione nantu à u sistema di almacenamiento. Per fà questu, selezziunate i campi A è O.

U mecanismu VAAI permette di trasfiriri una parte di u travagliu da l'ipervisore direttamente à u sistema di almacenamento, per esempiu, zeroing, copia di blocchi o bluccatu.

Analisi di prestazioni di VM in VMware vSphere. Parte 3: Storage

Comu pudete vede in a stampa sopra, VAAI travaglia nantu à stu sistema di almacenamento: i primitivi Zero è ATS sò attivamente utilizati.

Cunsiglii per ottimisà u travagliu cù u sottosistema di discu in ESXi

  • Prestate attenzione à a dimensione di u bloccu.
  • Stabbilisce a dimensione ottima di fila nantu à l'HBA.
  • Ùn vi scurdate di attivà SIOC in datastores.
  • Sceglite una PSP in cunfurmità cù i cunsiglii di u fabricatore di u sistema di almacenamento.
  • Assicuratevi chì VAAI funziona.

Articuli utili nantu à u tema:http://www.yellow-bricks.com/2011/06/23/disk-schednumreqoutstanding-the-story/
http://www.yellow-bricks.com/2009/09/29/whats-that-alua-exactly/
http://www.yellow-bricks.com/2019/03/05/dqlen-changes-what-is-going-on/
https://www.codyhosterman.com/2017/02/understanding-vmware-esxi-queuing-and-the-flasharray/
https://www.codyhosterman.com/2018/03/what-is-the-latency-stat-qavg/
https://kb.vmware.com/s/article/1267
https://kb.vmware.com/s/article/1268
https://kb.vmware.com/s/article/1027901
https://kb.vmware.com/s/article/2069356
https://kb.vmware.com/s/article/2053628
https://kb.vmware.com/s/article/1003469
https://www.vmware.com/content/dam/digitalmarketing/vmware/en/pdf/techpaper/performance/vsphere-esxi-vcenter-server-67-performance-best-practices.pdf

Source: www.habr.com

Add a comment