Analiza performansi VM-a u VMware vSphere. Dio 3: Skladištenje

Analiza performansi VM-a u VMware vSphere. Dio 3: Skladištenje

Dio 1. O CPU-u
Dio 2. O pamćenju

Danas ćemo analizirati metriku diskovnog podsustava u vSphere. Problem sa pohranom najčešći je razlog sporog virtualnog stroja. Ako, u slučaju CPU-a i RAM-a, rješavanje problema završava na razini hipervizora, onda ako postoje problemi s diskom, možda ćete se morati pozabaviti podatkovnom mrežom i sustavom za pohranu.

O ovoj ću temi raspravljati na primjeru blok pristupa sustavima za pohranu, iako su za pristup datotekama brojači približno isti.

Malo teorije

Kada se govori o performansama diskovnog podsustava virtualnih strojeva, ljudi obično obraćaju pozornost na tri međusobno povezana parametra:

  • broj ulazno/izlaznih operacija (Input/Output Operations Per Second, IOPS);
  • propusnost;
  • kašnjenje ulazno/izlaznih operacija (Latencija).

Broj IOPS obično važno za nasumična radna opterećenja: pristup blokovima diska koji se nalaze na različitim mjestima. Primjer takvog opterećenja mogu biti baze podataka, poslovne aplikacije (ERP, CRM) itd.

kapacitet važno za sekvencijalna opterećenja: pristup blokovima koji se nalaze jedan za drugim. Na primjer, poslužitelji datoteka (ali ne uvijek) i sustavi videonadzora mogu generirati takvo opterećenje.

Propusnost je povezana s brojem I/O operacija na sljedeći način:

Protok = IOPS * Veličina bloka, gdje je Block size veličina bloka.

Veličina bloka je prilično važna karakteristika. Moderne verzije ESXi dopuštaju blokove veličine do 32 KB. Ako je blok još veći, dijeli se na nekoliko. Ne mogu svi sustavi za pohranu učinkovito raditi s tako velikim blokovima, pa postoji parametar DiskMaxIOSize u naprednim postavkama ESXi. Pomoću njega možete smanjiti maksimalnu veličinu bloka koji hipervizor preskače (više detalja здесь). Prije promjene ovog parametra preporučujem da se posavjetujete s proizvođačem sustava za pohranu ili barem testirate promjene na laboratorijskom stolu. 

Velika veličina bloka može imati štetan učinak na performanse pohrane. Čak i ako su broj IOPS-a i propusnost relativno mali, velike latencije mogu se primijetiti s velikom veličinom bloka. Stoga obratite pozornost na ovaj parametar.

skrivenost – najzanimljiviji parametar performansi. I/O kašnjenje za virtualni stroj sastoji se od:

  • kašnjenja unutar hipervizora (KAVG, Average Kernel MilliSec/Read);
  • kašnjenje koje osigurava podatkovna mreža i sustav za pohranu (DAVG, Average Driver MilliSec/Command).

Ukupna latencija koja je vidljiva u OS-u za goste (GAVG, Average Guest MilliSec/Command) je zbroj KAVG-a i DAVG-a.

GAVG i DAVG se mjere i KAVG se izračunava: GAVG–DAVG.

Analiza performansi VM-a u VMware vSphere. Dio 3: Skladištenje
Источник

Pogledajmo pobliže KAVG. Tijekom normalnog rada, KAVG bi trebao težiti nuli ili barem biti puno manji od DAVG-a. Jedini slučaj za koji znam da je KAVG očekivano visok je ograničenje IOPS-a na VM disku. U ovom slučaju, kada pokušate prekoračiti ograničenje, KAVG će se povećati.

Najvažnija komponenta KAVG-a je QAVG - vrijeme čekanja za obradu unutar hipervizora. Preostale komponente KAVG-a su zanemarive.

Red čekanja u upravljačkom programu adaptera diska i red čekanja za mjesece imaju fiksnu veličinu. Za visoko opterećena okruženja, može biti korisno povećati ovu veličinu. Ovdje opisuje kako povećati red čekanja u upravljačkom programu adaptera (istovremeno će se povećati red čekanja na mjesece). Ova postavka radi kada samo jedan VM radi s mjesecom, što je rijetkost. Ako postoji nekoliko VM-ova na Mjesecu, također morate povećati parametar Disk.SchedNumReqOutstanding (upute  здесь). Povećanjem reda čekanja smanjujete QAVG odnosno KAVG.

Ali opet, prvo pročitajte dokumentaciju dobavljača HBA i testirajte promjene na laboratorijskom stolu.

Na veličinu čekanja do mjeseca može se utjecati uključivanjem mehanizma SIOC (Storage I/O Control). Omogućuje ujednačen pristup mjesecu sa svih poslužitelja u klasteru dinamičkom promjenom reda čekanja na mjesec na poslužiteljima. To jest, ako jedan od hostova pokreće VM koji zahtijeva neproporcionalnu količinu performansi (šumni susjed VM), SIOC smanjuje duljinu čekanja na mjesec na ovom hostu (DQLEN). Više detalja здесь.

Sredili smo KAVG, sad malo o tome DAVG. Ovdje je sve jednostavno: DAVG je kašnjenje koje uvodi vanjsko okruženje (podatkovna mreža i sustav za pohranu). Svaki moderan i manje moderan sustav za pohranu ima svoje brojače performansi. Za analizu problema s DAVG-om ima smisla pogledati ih. Ako je sve u redu na ESXi i strani pohrane, provjerite podatkovnu mrežu.

Da biste izbjegli probleme s performansama, odaberite ispravnu politiku odabira staze (PSP) za svoj sustav pohrane. Gotovo svi moderni sustavi za pohranu podržavaju PSP Round-Robin (sa ili bez ALUA, Asymmetric Logical Unit Access). Ovo vam pravilo omogućuje korištenje svih dostupnih puteva do sustava za pohranu. U slučaju ALUA, koriste se samo staze do kontrolera koji posjeduje mjesec. Nemaju svi sustavi pohrane na ESXi zadana pravila koja postavljaju pravilo Round-Robin. Ako ne postoji pravilo za vaš sustav za pohranu, upotrijebite dodatak proizvođača sustava za pohranu, koji će stvoriti odgovarajuće pravilo na svim hostovima u klasteru, ili napravite pravilo sami. pojedinosti здесь

Također, neki proizvođači sustava za pohranu preporučuju promjenu broja IOPS-a po putu sa standardne vrijednosti od 1000 na 1. U našoj praksi to je omogućilo da se iz sustava za pohranu „izvuče“ više performansi i značajno smanji vrijeme potrebno za failover u slučaju kvara ili ažuriranja kontrolera. Provjerite preporuke dobavljača i ako nema kontraindikacija, pokušajte promijeniti ovaj parametar. pojedinosti здесь.

Brojači performansi podsustava diska osnovnog virtualnog stroja

Brojači performansi diskovnog podsustava u vCenteru prikupljaju se u odjeljcima Datastore, Disk, Virtual Disk:

Analiza performansi VM-a u VMware vSphere. Dio 3: Skladištenje

U odjeljku Skladište podataka postoje metrike za skladišta diskova vSphere (datastore) na kojima se nalaze VM diskovi. Ovdje ćete pronaći standardne brojače za:

  • IOPS (prosječni broj zahtjeva za čitanje/pisanje u sekundi), 
  • propusnost (brzina čitanja/pisanja), 
  • kašnjenja (čitanje/pisanje/najveća latencija).

U principu, sve je jasno iz naziva brojača. Dopustite mi da vam još jednom skrenem pozornost na činjenicu da statistika ovdje nije za određeni VM (ili VM disk), već opća statistika za cijelu pohranu podataka. Po mom mišljenju, zgodnije je ovu statistiku pogledati u ESXTOP-u, barem na temelju činjenice da je minimalno razdoblje mjerenja tamo 2 sekunde.

U odjeljku Disk postoje metrike na blok uređajima koje koristi VM. Postoje brojači za IOPS tipa zbrajanja (broj ulazno/izlaznih operacija tijekom perioda mjerenja) i nekoliko brojača koji se odnose na pristup blokovima (naredbe prekinute, resetiranje sabirnice). Po mom mišljenju, također je prikladnije vidjeti ove informacije u ESXTOP-u.

Odjeljak Virtualni disk – najkorisniji sa stajališta pronalaženja problema performansi VM diskovnog podsustava. Ovdje možete vidjeti performanse za svaki virtualni disk. To je informacija koja je potrebna da bi se razumjelo ima li određeni virtualni stroj problem. Uz standardne brojače za broj I/O operacija, volumen čitanja/pisanja i kašnjenja, ovaj odjeljak sadrži korisne brojače koji pokazuju veličinu bloka: Veličina zahtjeva za čitanje/pisanje.

Slika ispod prikazuje grafikon performansi VM diska, gdje možete vidjeti broj IOPS-a, latenciju i veličinu bloka. 

Analiza performansi VM-a u VMware vSphere. Dio 3: Skladištenje

Također možete vidjeti metriku performansi za cijelu pohranu podataka ako je SIOC omogućen. Ovdje su osnovne informacije o prosječnoj latenciji i IOPS-u. Prema zadanim postavkama ove se informacije mogu vidjeti samo u stvarnom vremenu.

Analiza performansi VM-a u VMware vSphere. Dio 3: Skladištenje

ESXTOP

ESXTOP ima nekoliko ekrana koji pružaju informacije o podsustavu host diska u cjelini, pojedinačnim virtualnim strojevima i njihovim diskovima.

Počnimo s informacijama o virtualnim strojevima. Zaslon “Disk VM” poziva se tipkom “v”:

Analiza performansi VM-a u VMware vSphere. Dio 3: Skladištenje

NVDISK je broj VM diskova. Za pregled informacija za svaki disk pritisnite “e” i unesite GID VM-a od interesa.

Značenje preostalih parametara na ovom ekranu jasno je iz njihovih naziva.

Još jedan koristan zaslon pri rješavanju problema je adapter diska. Poziva se tipkom “d” (polja A,B,C,D,E,G odabrana su na slici ispod):

Analiza performansi VM-a u VMware vSphere. Dio 3: Skladištenje

NPTH – broj staza do mjeseca koji su vidljivi s ovog adaptera. Da biste dobili informacije za svaki put na adapteru, pritisnite “e” i unesite naziv adaptera:

Analiza performansi VM-a u VMware vSphere. Dio 3: Skladištenje

AQLEN – maksimalna veličina reda čekanja na adapteru.

Također na ovom ekranu su brojači kašnjenja o kojima sam govorio gore: KAVG/cmd, GAVG/cmd, DAVG/cmd, QAVG/cmd.

Zaslon Disk uređaj koji se poziva pritiskom na tipku “u” daje informacije o pojedinim blok uređajima – lunama (na slici ispod odabrana su polja A, B, F, G, I). Ovdje možete vidjeti status čekanja za mjesece.

Analiza performansi VM-a u VMware vSphere. Dio 3: Skladištenje

DQLEN – veličina čekanja za blok uređaj.
ACTV – broj I/O naredbi u ESXi kernelu.
QUED – broj I/O naredbi u redu.
% USD – ACTV / DQLEN × 100%.
OPTEREĆENJE – (ACTV + QUED) / DQLEN.

Ako je %USD visok, razmislite o povećanju reda čekanja. Što je više naredbi u redu čekanja, to je veći QAVG i, sukladno tome, KAVG.

Također možete vidjeti na zaslonu Disk uređaja radi li VAAI (vStorage API za integraciju polja) na sustavu za pohranu. Da biste to učinili, odaberite polja A i O.

VAAI mehanizam omogućuje prijenos dijela posla s hipervizora izravno na sustav za pohranu, na primjer, nuliranje, kopiranje blokova ili blokiranje.

Analiza performansi VM-a u VMware vSphere. Dio 3: Skladištenje

Kao što možete vidjeti na gornjoj slici, VAAI radi na ovom sustavu pohrane: Zero i ATS primitive se aktivno koriste.

Savjeti za optimizaciju rada s diskovnim podsustavom na ESXi

  • Obratite pozornost na veličinu bloka.
  • Postavite optimalnu veličinu čekanja na HBA.
  • Ne zaboravite omogućiti SIOC na spremištima podataka.
  • Odaberite PSP u skladu s preporukama proizvođača sustava za pohranu.
  • Provjerite radi li VAAI.

Korisni članci na temu:http://www.yellow-bricks.com/2011/06/23/disk-schednumreqoutstanding-the-story/
http://www.yellow-bricks.com/2009/09/29/whats-that-alua-exactly/
http://www.yellow-bricks.com/2019/03/05/dqlen-changes-what-is-going-on/
https://www.codyhosterman.com/2017/02/understanding-vmware-esxi-queuing-and-the-flasharray/
https://www.codyhosterman.com/2018/03/what-is-the-latency-stat-qavg/
https://kb.vmware.com/s/article/1267
https://kb.vmware.com/s/article/1268
https://kb.vmware.com/s/article/1027901
https://kb.vmware.com/s/article/2069356
https://kb.vmware.com/s/article/2053628
https://kb.vmware.com/s/article/1003469
https://www.vmware.com/content/dam/digitalmarketing/vmware/en/pdf/techpaper/performance/vsphere-esxi-vcenter-server-67-performance-best-practices.pdf

Izvor: www.habr.com

Dodajte komentar