Analiza performansi VM-a u VMware vSphere. Dio 3: Skladištenje

Analiza performansi VM-a u VMware vSphere. Dio 3: Skladištenje

Dio 1. O CPU-u
Dio 2. O memoriji

Danas ćemo analizirati metriku diskovnog podsistema u vSphere. Problem sa skladištenjem je najčešći razlog za sporu virtuelnu mašinu. Ako se, u slučaju CPU-a i RAM-a, rješavanje problema završi na nivou hipervizora, onda ako postoje problemi s diskom, možda ćete morati da se pozabavite mrežom podataka i sistemom za skladištenje podataka.

Razgovarat ću o ovoj temi koristeći primjer blokiranja pristupa sistemima za skladištenje podataka, iako su za pristup fajlovima brojači približno isti.

Malo teorije

Kada se govori o performansama diskovnog podsistema virtuelnih mašina, ljudi obično obraćaju pažnju na tri međusobno povezana parametra:

  • broj ulazno/izlaznih operacija (ulazno/izlazne operacije u sekundi, IOPS);
  • propusnost;
  • kašnjenje ulazno/izlaznih operacija (latencija).

Broj IOPS obično važno za nasumična radna opterećenja: pristup blokovima diska koji se nalaze na različitim mjestima. Primjer takvog opterećenja mogu biti baze podataka, poslovne aplikacije (ERP, CRM) itd.

Propusnost važno za uzastopna opterećenja: pristup blokovima koji se nalaze jedan za drugim. Na primjer, serveri datoteka (ali ne uvijek) i sistemi video nadzora mogu generirati takvo opterećenje.

Propusnost je povezana sa brojem I/O operacija na sljedeći način:

Protok = IOPS * Veličina bloka, gdje je veličina bloka veličina bloka.

Veličina bloka je prilično važna karakteristika. Moderne verzije ESXi dozvoljavaju blokove veličine do 32 KB. Ako je blok još veći, dijeli se na nekoliko. Ne mogu svi sistemi za skladištenje efikasno raditi sa tako velikim blokovima, tako da postoji parametar DiskMaxIOSize u ESXi naprednim postavkama. Koristeći ga, možete smanjiti maksimalnu veličinu bloka koju hipervizor preskoči (više detalja ovdje). Prije promjene ovog parametra, preporučujem da se konsultujete sa proizvođačem sistema za skladištenje ili barem testirate promene na laboratorijskom stolu. 

Velika veličina bloka može imati štetan učinak na performanse pohrane. Čak i ako su broj IOPS-a i propusnost relativno mali, velike latencije se mogu uočiti kod velike veličine bloka. Stoga obratite pažnju na ovaj parametar.

latentnost – najzanimljiviji parametar performansi. I/O latencija za virtuelnu mašinu sastoji se od:

  • kašnjenja unutar hipervizora (KAVG, Average Kernel MilliSec/Read);
  • kašnjenje koje obezbeđuje mreža podataka i sistem skladištenja (DAVG, Average Driver MilliSec/Command).

Ukupna latencija koja je vidljiva u gostujućem OS-u (GAVG, Average Guest MilliSec/Command) je zbir KAVG i DAVG.

GAVG i DAVG se mjere i KAVG se izračunava: GAVG–DAVG.

Analiza performansi VM-a u VMware vSphere. Dio 3: Skladištenje
Izvor

Pogledajmo izbliza KAVG. Tokom normalnog rada, KAVG bi trebao težiti nuli ili barem biti mnogo manji od DAVG. Jedini slučaj za koji znam gdje je KAVG očekivano visok je ograničenje IOPS-a na VM disku. U tom slučaju, kada pokušate prekoračiti ograničenje, KAVG će se povećati.

Najznačajnija komponenta KAVG-a je QAVG - vrijeme čekanja za obradu unutar hipervizora. Preostale komponente KAVG-a su zanemarljive.

Red u drajveru adaptera diska i red do mjeseca ima fiksnu veličinu. Za okruženja sa visokim opterećenjem, može biti korisno povećati ovu veličinu. to je opisuje kako povećati redove u drajveru adaptera (u isto vrijeme će se povećati red do mjeseca). Ova postavka radi kada samo jedan VM radi sa Mjesecom, što je rijetko. Ako postoji nekoliko VM-ova na Mjesecu, također morate povećati parametar Disk.SchedNumReqOutstanding (instrukcije  ovdje). Povećanjem reda, smanjujete QAVG i KAVG respektivno.

Ali opet, prvo pročitajte dokumentaciju od HBA dobavljača i testirajte promjene na laboratorijskom stolu.

Uključivanjem SIOC (Storage I/O Control) mehanizma može uticati na veličinu reda čekanja do mjeseca. Pruža ujednačen pristup mjesecu sa svih servera u klasteru dinamičkim mijenjanjem reda do mjeseca na serverima. To jest, ako jedan od hostova pokreće VM koji zahtijeva nesrazmjernu količinu performansi (bučni susjedni VM), SIOC smanjuje dužinu reda do mjeseca na ovom hostu (DQLEN). Više detalja ovdje.

Sredili smo KAVG, sada malo o tome DAVG. Ovde je sve jednostavno: DAVG je kašnjenje koje unosi spoljno okruženje (mreža podataka i sistem za skladištenje). Svaki moderan i ne tako moderan sistem za skladištenje ima svoje brojače performansi. Da biste analizirali probleme sa DAVG-om, ima smisla pogledati ih. Ako je sve u redu na strani ESXi i skladišta, provjerite mrežu podataka.

Da biste izbjegli probleme s performansama, odaberite ispravnu politiku odabira putanje (PSP) za vaš sistem pohrane. Gotovo svi moderni sistemi za skladištenje podržavaju PSP Round-Robin (sa ili bez ALUA, Asimetrični pristup logičkoj jedinici). Ova politika vam omogućava da koristite sve dostupne staze do sistema skladištenja. U slučaju ALUA, koriste se samo putevi do kontrolera koji posjeduje mjesec. Nemaju svi sistemi za skladištenje na ESXi-u podrazumevana pravila koja postavljaju Round-Robin politiku. Ako ne postoji pravilo za vaš sistem skladištenja, koristite dodatak proizvođača sistema za skladištenje koji će kreirati odgovarajuće pravilo na svim hostovima u klasteru ili sami kreirajte pravilo. Detalji ovdje

Takođe, neki proizvođači sistema skladištenja preporučuju promenu broja IOPS-a po putanji sa standardne vrednosti od 1000 na 1. U našoj praksi, to je omogućilo da se „iscedi” više performansi iz sistema skladištenja i značajno smanji vreme potrebno za prelazak na grešku. u slučaju kvara ili ažuriranja kontrolera. Provjerite preporuke dobavljača i ako nema kontraindikacija, pokušajte promijeniti ovaj parametar. Detalji ovdje.

Brojači performansi podsistema diska osnovne virtuelne mašine

Brojači performansi podsistema diska u vCenter-u se prikupljaju u odeljcima Datastore, Disk, Virtual Disk:

Analiza performansi VM-a u VMware vSphere. Dio 3: Skladištenje

odjeljak Skladištenje podataka postoje metrike za vSphere diskove (skladišta podataka) na kojima se nalaze VM diskovi. Ovdje ćete pronaći standardne brojače za:

  • IOPS (prosječan broj zahtjeva za čitanje/pisanje u sekundi), 
  • propusnost (brzina čitanja/pisanja), 
  • kašnjenja (čitanje/pisanje/najveća latencija).

U principu, sve je jasno iz naziva brojača. Dozvolite mi da vam još jednom skrenem pažnju na činjenicu da ovde statistika nije za određeni VM (ili VM disk), već opšta statistika za čitavo skladište podataka. Po mom mišljenju, ove statistike je zgodnije pogledati u ESXTOP-u, barem na osnovu činjenice da je minimalni period mjerenja tamo 2 sekunde.

odjeljak disk postoje metrike na blok uređajima koje koristi VM. Postoje brojači za IOPS tipa sumiranja (broj ulazno/izlaznih operacija tokom perioda merenja) i nekoliko brojača koji se odnose na blokiranje pristupa (naredbe prekinute, sabirnica se resetuje). Po mom mišljenju, takođe je zgodnije pogledati ove informacije u ESXTOP-u.

Odeljak Virtuelni disk – najkorisniji sa stanovišta pronalaženja problema performansi podsistema VM diska. Ovdje možete vidjeti performanse za svaki virtualni disk. Upravo su te informacije potrebne da bi se razumjelo da li određena virtualna mašina ima problem. Pored standardnih brojača za broj I/O operacija, volumen čitanja/pisanja i kašnjenja, ovaj odjeljak sadrži korisne brojače koji pokazuju veličinu bloka: veličinu zahtjeva za čitanje/pisanje.

Na slici ispod je grafikon performansi VM diska, gdje možete vidjeti broj IOPS, kašnjenje i veličinu bloka. 

Analiza performansi VM-a u VMware vSphere. Dio 3: Skladištenje

Također možete vidjeti metriku performansi za cijelo skladište podataka ako je SIOC omogućen. Ovdje su osnovne informacije o prosječnom kašnjenju i IOPS. Podrazumevano, ove informacije se mogu vidjeti samo u realnom vremenu.

Analiza performansi VM-a u VMware vSphere. Dio 3: Skladištenje

ESXTOP

ESXTOP ima nekoliko ekrana koji pružaju informacije o podsistemu host diska u cjelini, pojedinačnim virtuelnim mašinama i njihovim diskovima.

Počnimo sa informacijama o virtuelnim mašinama. Ekran “Disk VM” se poziva tipkom “v”:

Analiza performansi VM-a u VMware vSphere. Dio 3: Skladištenje

NVDISK je broj VM diskova. Za pregled informacija za svaki disk, pritisnite “e” i unesite GID VM-a od interesa.

Značenje preostalih parametara na ovom ekranu jasno je iz njihovih naziva.

Još jedan koristan ekran pri rješavanju problema je Disk adapter. Poziva se tipkom "d" (polja A,B,C,D,E,G su odabrana na slici ispod):

Analiza performansi VM-a u VMware vSphere. Dio 3: Skladištenje

NPTH – broj puteva do mjeseca koji su vidljivi sa ovog adaptera. Da biste dobili informacije za svaku putanju na adapteru, pritisnite “e” i unesite naziv adaptera:

Analiza performansi VM-a u VMware vSphere. Dio 3: Skladištenje

AQLEN – maksimalna veličina reda na adapteru.

Na ovom ekranu su i brojači kašnjenja o kojima sam govorio gore: KAVG/cmd, GAVG/cmd, DAVG/cmd, QAVG/cmd.

Ekran Disk uređaja, koji se poziva pritiskom na tipku "u", daje informacije o pojedinačnim blok uređajima - mjesecima (na slici ispod su odabrana polja A, B, F, G, I). Ovdje možete vidjeti status reda za mjesece.

Analiza performansi VM-a u VMware vSphere. Dio 3: Skladištenje

DQLEN – veličina reda za blok uređaj.
ACTV – broj I/O naredbi u ESXi kernelu.
QUED – broj I/O naredbi u redu.
%AMERIČKI DOLAR – ACTV / DQLEN × 100%.
LOAD – (ACTV + QUED) / DQLEN.

Ako je %USD visok, trebali biste razmisliti o povećanju reda čekanja. Što je više komandi u redu čekanja, veći je QAVG i, shodno tome, KAVG.

Također možete vidjeti na ekranu Disk uređaja da li VAAI (vStorage API za integraciju niza) radi na sistemu za pohranu. Da biste to učinili, odaberite polja A i O.

VAAI mehanizam vam omogućava da prenesete dio posla s hipervizora direktno na sistem za pohranu, na primjer, nuliranje, kopiranje blokova ili blokiranje.

Analiza performansi VM-a u VMware vSphere. Dio 3: Skladištenje

Kao što možete vidjeti na gornjoj slici, VAAI radi na ovom sistemu skladištenja: aktivno se koriste Zero i ATS primitivi.

Savjeti za optimizaciju rada sa podsistemom diska na ESXi

  • Obratite pažnju na veličinu bloka.
  • Postavite optimalnu veličinu reda na HBA.
  • Ne zaboravite da omogućite SIOC na datastorama.
  • Izaberite PSP u skladu sa preporukama proizvođača sistema za skladištenje podataka.
  • Provjerite radi li VAAI.

Korisni članci na ovu temu:http://www.yellow-bricks.com/2011/06/23/disk-schednumreqoutstanding-the-story/
http://www.yellow-bricks.com/2009/09/29/whats-that-alua-exactly/
http://www.yellow-bricks.com/2019/03/05/dqlen-changes-what-is-going-on/
https://www.codyhosterman.com/2017/02/understanding-vmware-esxi-queuing-and-the-flasharray/
https://www.codyhosterman.com/2018/03/what-is-the-latency-stat-qavg/
https://kb.vmware.com/s/article/1267
https://kb.vmware.com/s/article/1268
https://kb.vmware.com/s/article/1027901
https://kb.vmware.com/s/article/2069356
https://kb.vmware.com/s/article/2053628
https://kb.vmware.com/s/article/1003469
https://www.vmware.com/content/dam/digitalmarketing/vmware/en/pdf/techpaper/performance/vsphere-esxi-vcenter-server-67-performance-best-practices.pdf

izvor: www.habr.com

Dodajte komentar