Danas ćemo analizirati metriku diskovnog podsustava u vSphere. Problem sa pohranom najčešći je razlog sporog virtualnog stroja. Ako, u slučaju CPU-a i RAM-a, rješavanje problema završava na razini hipervizora, onda ako postoje problemi s diskom, možda ćete se morati pozabaviti podatkovnom mrežom i sustavom za pohranu.
O ovoj ću temi raspravljati na primjeru blok pristupa sustavima za pohranu, iako su za pristup datotekama brojači približno isti.
Malo teorije
Kada se govori o performansama diskovnog podsustava virtualnih strojeva, ljudi obično obraćaju pozornost na tri međusobno povezana parametra:
- broj ulazno/izlaznih operacija (Input/Output Operations Per Second, IOPS);
- propusnost;
- kašnjenje ulazno/izlaznih operacija (Latencija).
Broj IOPS obično važno za nasumična radna opterećenja: pristup blokovima diska koji se nalaze na različitim mjestima. Primjer takvog opterećenja mogu biti baze podataka, poslovne aplikacije (ERP, CRM) itd.
kapacitet važno za sekvencijalna opterećenja: pristup blokovima koji se nalaze jedan za drugim. Na primjer, poslužitelji datoteka (ali ne uvijek) i sustavi videonadzora mogu generirati takvo opterećenje.
Propusnost je povezana s brojem I/O operacija na sljedeći način:
Protok = IOPS * Veličina bloka, gdje je Block size veličina bloka.
Veličina bloka je prilično važna karakteristika. Moderne verzije ESXi dopuštaju blokove veličine do 32 KB. Ako je blok još veći, dijeli se na nekoliko. Ne mogu svi sustavi za pohranu učinkovito raditi s tako velikim blokovima, pa postoji parametar DiskMaxIOSize u naprednim postavkama ESXi. Pomoću njega možete smanjiti maksimalnu veličinu bloka koji hipervizor preskače (više detalja
Velika veličina bloka može imati štetan učinak na performanse pohrane. Čak i ako su broj IOPS-a i propusnost relativno mali, velike latencije mogu se primijetiti s velikom veličinom bloka. Stoga obratite pozornost na ovaj parametar.
skrivenost – najzanimljiviji parametar performansi. I/O kašnjenje za virtualni stroj sastoji se od:
- kašnjenja unutar hipervizora (KAVG, Average Kernel MilliSec/Read);
- kašnjenje koje osigurava podatkovna mreža i sustav za pohranu (DAVG, Average Driver MilliSec/Command).
Ukupna latencija koja je vidljiva u OS-u za goste (GAVG, Average Guest MilliSec/Command) je zbroj KAVG-a i DAVG-a.
GAVG i DAVG se mjere i KAVG se izračunava: GAVG–DAVG.
Pogledajmo pobliže KAVG. Tijekom normalnog rada, KAVG bi trebao težiti nuli ili barem biti puno manji od DAVG-a. Jedini slučaj za koji znam da je KAVG očekivano visok je ograničenje IOPS-a na VM disku. U ovom slučaju, kada pokušate prekoračiti ograničenje, KAVG će se povećati.
Najvažnija komponenta KAVG-a je QAVG - vrijeme čekanja za obradu unutar hipervizora. Preostale komponente KAVG-a su zanemarive.
Red čekanja u upravljačkom programu adaptera diska i red čekanja za mjesece imaju fiksnu veličinu. Za visoko opterećena okruženja, može biti korisno povećati ovu veličinu.
Ali opet, prvo pročitajte dokumentaciju dobavljača HBA i testirajte promjene na laboratorijskom stolu.
Na veličinu čekanja do mjeseca može se utjecati uključivanjem mehanizma SIOC (Storage I/O Control). Omogućuje ujednačen pristup mjesecu sa svih poslužitelja u klasteru dinamičkom promjenom reda čekanja na mjesec na poslužiteljima. To jest, ako jedan od hostova pokreće VM koji zahtijeva neproporcionalnu količinu performansi (šumni susjed VM), SIOC smanjuje duljinu čekanja na mjesec na ovom hostu (DQLEN). Više detalja
Sredili smo KAVG, sad malo o tome DAVG. Ovdje je sve jednostavno: DAVG je kašnjenje koje uvodi vanjsko okruženje (podatkovna mreža i sustav za pohranu). Svaki moderan i manje moderan sustav za pohranu ima svoje brojače performansi. Za analizu problema s DAVG-om ima smisla pogledati ih. Ako je sve u redu na ESXi i strani pohrane, provjerite podatkovnu mrežu.
Da biste izbjegli probleme s performansama, odaberite ispravnu politiku odabira staze (PSP) za svoj sustav pohrane. Gotovo svi moderni sustavi za pohranu podržavaju PSP Round-Robin (sa ili bez ALUA, Asymmetric Logical Unit Access). Ovo vam pravilo omogućuje korištenje svih dostupnih puteva do sustava za pohranu. U slučaju ALUA, koriste se samo staze do kontrolera koji posjeduje mjesec. Nemaju svi sustavi pohrane na ESXi zadana pravila koja postavljaju pravilo Round-Robin. Ako ne postoji pravilo za vaš sustav za pohranu, upotrijebite dodatak proizvođača sustava za pohranu, koji će stvoriti odgovarajuće pravilo na svim hostovima u klasteru, ili napravite pravilo sami. pojedinosti
Također, neki proizvođači sustava za pohranu preporučuju promjenu broja IOPS-a po putu sa standardne vrijednosti od 1000 na 1. U našoj praksi to je omogućilo da se iz sustava za pohranu „izvuče“ više performansi i značajno smanji vrijeme potrebno za failover u slučaju kvara ili ažuriranja kontrolera. Provjerite preporuke dobavljača i ako nema kontraindikacija, pokušajte promijeniti ovaj parametar. pojedinosti
Brojači performansi podsustava diska osnovnog virtualnog stroja
Brojači performansi diskovnog podsustava u vCenteru prikupljaju se u odjeljcima Datastore, Disk, Virtual Disk:
U odjeljku Skladište podataka postoje metrike za skladišta diskova vSphere (datastore) na kojima se nalaze VM diskovi. Ovdje ćete pronaći standardne brojače za:
- IOPS (prosječni broj zahtjeva za čitanje/pisanje u sekundi),
- propusnost (brzina čitanja/pisanja),
- kašnjenja (čitanje/pisanje/najveća latencija).
U principu, sve je jasno iz naziva brojača. Dopustite mi da vam još jednom skrenem pozornost na činjenicu da statistika ovdje nije za određeni VM (ili VM disk), već opća statistika za cijelu pohranu podataka. Po mom mišljenju, zgodnije je ovu statistiku pogledati u ESXTOP-u, barem na temelju činjenice da je minimalno razdoblje mjerenja tamo 2 sekunde.
U odjeljku Disk postoje metrike na blok uređajima koje koristi VM. Postoje brojači za IOPS tipa zbrajanja (broj ulazno/izlaznih operacija tijekom perioda mjerenja) i nekoliko brojača koji se odnose na pristup blokovima (naredbe prekinute, resetiranje sabirnice). Po mom mišljenju, također je prikladnije vidjeti ove informacije u ESXTOP-u.
Odjeljak Virtualni disk – najkorisniji sa stajališta pronalaženja problema performansi VM diskovnog podsustava. Ovdje možete vidjeti performanse za svaki virtualni disk. To je informacija koja je potrebna da bi se razumjelo ima li određeni virtualni stroj problem. Uz standardne brojače za broj I/O operacija, volumen čitanja/pisanja i kašnjenja, ovaj odjeljak sadrži korisne brojače koji pokazuju veličinu bloka: Veličina zahtjeva za čitanje/pisanje.
Slika ispod prikazuje grafikon performansi VM diska, gdje možete vidjeti broj IOPS-a, latenciju i veličinu bloka.
Također možete vidjeti metriku performansi za cijelu pohranu podataka ako je SIOC omogućen. Ovdje su osnovne informacije o prosječnoj latenciji i IOPS-u. Prema zadanim postavkama ove se informacije mogu vidjeti samo u stvarnom vremenu.
ESXTOP
ESXTOP ima nekoliko ekrana koji pružaju informacije o podsustavu host diska u cjelini, pojedinačnim virtualnim strojevima i njihovim diskovima.
Počnimo s informacijama o virtualnim strojevima. Zaslon “Disk VM” poziva se tipkom “v”:
NVDISK je broj VM diskova. Za pregled informacija za svaki disk pritisnite “e” i unesite GID VM-a od interesa.
Značenje preostalih parametara na ovom ekranu jasno je iz njihovih naziva.
Još jedan koristan zaslon pri rješavanju problema je adapter diska. Poziva se tipkom “d” (polja A,B,C,D,E,G odabrana su na slici ispod):
NPTH – broj staza do mjeseca koji su vidljivi s ovog adaptera. Da biste dobili informacije za svaki put na adapteru, pritisnite “e” i unesite naziv adaptera:
AQLEN – maksimalna veličina reda čekanja na adapteru.
Također na ovom ekranu su brojači kašnjenja o kojima sam govorio gore: KAVG/cmd, GAVG/cmd, DAVG/cmd, QAVG/cmd.
Zaslon Disk uređaj koji se poziva pritiskom na tipku “u” daje informacije o pojedinim blok uređajima – lunama (na slici ispod odabrana su polja A, B, F, G, I). Ovdje možete vidjeti status čekanja za mjesece.
DQLEN – veličina čekanja za blok uređaj.
ACTV – broj I/O naredbi u ESXi kernelu.
QUED – broj I/O naredbi u redu.
% USD – ACTV / DQLEN × 100%.
OPTEREĆENJE – (ACTV + QUED) / DQLEN.
Ako je %USD visok, razmislite o povećanju reda čekanja. Što je više naredbi u redu čekanja, to je veći QAVG i, sukladno tome, KAVG.
Također možete vidjeti na zaslonu Disk uređaja radi li VAAI (vStorage API za integraciju polja) na sustavu za pohranu. Da biste to učinili, odaberite polja A i O.
VAAI mehanizam omogućuje prijenos dijela posla s hipervizora izravno na sustav za pohranu, na primjer, nuliranje, kopiranje blokova ili blokiranje.
Kao što možete vidjeti na gornjoj slici, VAAI radi na ovom sustavu pohrane: Zero i ATS primitive se aktivno koriste.
Savjeti za optimizaciju rada s diskovnim podsustavom na ESXi
- Obratite pozornost na veličinu bloka.
- Postavite optimalnu veličinu čekanja na HBA.
- Ne zaboravite omogućiti SIOC na spremištima podataka.
- Odaberite PSP u skladu s preporukama proizvođača sustava za pohranu.
- Provjerite radi li VAAI.
Korisni članci na temu:
Izvor: www.habr.com