Analiza e performancës së VM në VMware vSphere. Pjesa 3: Magazinimi

Analiza e performancës së VM në VMware vSphere. Pjesa 3: Magazinimi

Pjesa 1. Rreth CPU
Pjesa 2. Rreth kujtesës

Sot do të analizojmë matjet e nënsistemit të diskut në vSphere. Një problem i ruajtjes është arsyeja më e zakonshme për një makinë virtuale të ngadaltë. Nëse, në rastin e CPU dhe RAM, zgjidhja e problemeve përfundon në nivelin e hipervizorit, atëherë nëse ka probleme me diskun, mund t'ju duhet të merreni me rrjetin e të dhënave dhe sistemin e ruajtjes.

Unë do të diskutoj temën duke përdorur shembullin e aksesit të bllokut në sistemet e ruajtjes, megjithëse për aksesin e skedarëve numëruesit janë afërsisht të njëjtë.

Pak teori

Kur flasim për performancën e nënsistemit të diskut të makinave virtuale, njerëzit zakonisht i kushtojnë vëmendje tre parametrave të ndërlidhur:

  • numri i operacioneve hyrëse/dalëse (Operacionet hyrëse/dalëse për sekondë, IOPS);
  • xhiros;
  • vonesa e operacioneve hyrëse/dalëse (Latency).

Numri i IOPS zakonisht i rëndësishëm për ngarkesat e rastësishme të punës: qasja në blloqet e disqeve të vendosura në vende të ndryshme. Një shembull i një ngarkese të tillë mund të jenë bazat e të dhënave, aplikacionet e biznesit (ERP, CRM), etj.

kapacitet e rëndësishme për ngarkesat vijuese: qasja në blloqe të vendosura njëri pas tjetrit. Për shembull, serverët e skedarëve (por jo gjithmonë) dhe sistemet e mbikëqyrjes video mund të gjenerojnë një ngarkesë të tillë.

Përfundimi lidhet me numrin e operacioneve I/O si më poshtë:

Përfundimi = IOPS * Madhësia e bllokut, ku Madhësia e bllokut është madhësia e bllokut.

Madhësia e bllokut është një karakteristikë mjaft e rëndësishme. Versionet moderne të ESXi lejojnë blloqe deri në 32 KB në madhësi. Nëse blloku është edhe më i madh, ai ndahet në disa. Jo të gjitha sistemet e ruajtjes mund të punojnë me efikasitet me blloqe kaq të mëdha, kështu që ekziston një parametër DiskMaxIOSize në Cilësimet e Avancuara ESXi. Duke e përdorur atë, ju mund të zvogëloni madhësinë maksimale të bllokut të anashkaluar nga hipervizori (më shumë detaje këtu). Përpara se të ndryshoni këtë parametër, ju rekomandoj të konsultoheni me prodhuesin e sistemit të ruajtjes ose të paktën të provoni ndryshimet në një stol laboratori. 

Një madhësi e madhe blloku mund të ketë një efekt të dëmshëm në performancën e ruajtjes. Edhe nëse numri i IOPS dhe xhiros janë relativisht të vogla, vonesat e larta mund të vërehen me një madhësi të madhe blloku. Prandaj, kushtojini vëmendje këtij parametri.

gjendje latente – parametri më interesant i performancës. Vonesa e I/O për një makinë virtuale përbëhet nga:

  • vonesat brenda hipervizorit (KAVG, Average Kernel MilliSec/Read);
  • vonesë e ofruar nga rrjeti i të dhënave dhe sistemi i ruajtjes (DAVG, Average Driver MilliSec/Command).

Vonesa totale që është e dukshme në sistemin operativ të ftuar (GAVG, MilliSec/Komanda mesatare e vizitorëve) është shuma e KAVG dhe DAVG.

GAVG dhe DAVG maten dhe KAVG llogaritet: GAVG–DAVG.

Analiza e performancës së VM në VMware vSphere. Pjesa 3: Magazinimi
Burim

Le t'i hedhim një vështrim më të afërt KAVG. Gjatë funksionimit normal, KAVG duhet të priret në zero ose të paktën të jetë shumë më pak se DAVG. I vetmi rast që di ku KAVG pritet të jetë i lartë është kufiri IOPS në diskun VM. Në këtë rast, kur përpiqeni të tejkaloni kufirin, KAVG do të rritet.

Komponenti më i rëndësishëm i KAVG është QAVG - koha e radhës së përpunimit brenda hipervizorit. Përbërësit e mbetur të KAVG janë të papërfillshëm.

Radha në drejtuesin e përshtatësit të diskut dhe radha në hëna ka një madhësi fikse. Për mjedise shumë të ngarkuara, mund të jetë e dobishme të rritet kjo madhësi. Këtu përshkruan se si të rriten radhët në drejtuesin e përshtatësit (në të njëjtën kohë radha për në hënë do të rritet). Ky cilësim funksionon kur vetëm një VM punon me hënën, gjë që është e rrallë. Nëse ka disa VM në hënë, duhet të rrisni edhe parametrin Disk.SchedNumReqOutstanding (udhëzime  këtu). Duke rritur radhën, ju ulni përkatësisht QAVG dhe KAVG.

Por përsëri, së pari lexoni dokumentacionin nga shitësi HBA dhe provoni ndryshimet në një stol laboratori.

Madhësia e radhës për në hënë mund të ndikohet nga përfshirja e mekanizmit SIOC (Storage I/O Control). Ai siguron qasje uniforme në hënë nga të gjithë serverët në grup duke ndryshuar në mënyrë dinamike radhën në hënë në serverë. Kjo do të thotë, nëse një nga hostet po ekzekuton një VM që kërkon një sasi joproporcionale të performancës (fqinj i zhurmshëm VM), SIOC zvogëlon gjatësinë e radhës në hënë në këtë host (DQLEN). Më shumë detaje këtu.

Kemi rregulluar KAVG, tani pak DAVG. Gjithçka është e thjeshtë këtu: DAVG është vonesa e paraqitur nga mjedisi i jashtëm (rrjeti i të dhënave dhe sistemi i ruajtjes). Çdo sistem magazinimi modern dhe jo aq modern ka sportelet e veta të performancës. Për të analizuar problemet me DAVG, ka kuptim t'i shikoni ato. Nëse gjithçka është në rregull në anën e ESXi dhe ruajtjes, kontrolloni rrjetin e të dhënave.

Për të shmangur problemet e performancës, zgjidhni politikën e duhur të zgjedhjes së rrugës (PSP) për sistemin tuaj të ruajtjes. Pothuajse të gjitha sistemet moderne të ruajtjes mbështesin PSP Round-Robin (me ose pa ALUA, Asimetrike Logical Unit Access). Kjo politikë ju lejon të përdorni të gjitha shtigjet e disponueshme për në sistemin e ruajtjes. Në rastin e ALUA, përdoren vetëm shtigjet drejt kontrolluesit që zotëron hënën. Jo të gjitha sistemet e ruajtjes në ESXi kanë rregulla të paracaktuara që përcaktojnë politikën Round-Robin. Nëse nuk ka rregull për sistemin tuaj të ruajtjes, përdorni një shtesë nga prodhuesi i sistemit të ruajtjes, i cili do të krijojë një rregull përkatës për të gjithë hostet në grup, ose krijoni vetë një rregull. Detajet këtu

Gjithashtu, disa prodhues të sistemeve të ruajtjes rekomandojnë ndryshimin e numrit të IOPS për shteg nga vlera standarde prej 1000 në 1. Në praktikën tonë, kjo bëri të mundur "shtrydhjen" më të madhe të performancës nga sistemi i ruajtjes dhe reduktimin e ndjeshëm të kohës së kërkuar për dështimin. në rast të dështimit ose përditësimit të kontrollorit. Kontrolloni rekomandimet e shitësit dhe nëse nuk ka kundërindikacione, provoni ta ndryshoni këtë parametër. Detajet këtu.

Numëruesit bazë të performancës së nënsistemit të diskut të makinës virtuale

Numëruesit e performancës së nënsistemit të diskut në vCenter mblidhen në seksionet Datastore, Disk, Virtual Disk:

Analiza e performancës së VM në VMware vSphere. Pjesa 3: Magazinimi

Në seksionin Magazina e të dhënave ka metrika për ruajtjen e diskut (datastores) vSphere në të cilat ndodhen disqet VM. Këtu do të gjeni sportelet standarde për:

  • IOPS (Kërkesat mesatare për lexim/shkrim për sekondë), 
  • xhiroja (shkalla e leximit/shkrimit), 
  • vonesat (Lexo/Shkruaj/Vonesat më të larta).

Në parim, gjithçka është e qartë nga emrat e sporteleve. Më lejoni të tërheq vëmendjen tuaj edhe një herë për faktin se statistikat këtu nuk janë për një VM specifike (ose disk VM), por statistika të përgjithshme për të gjithë dyqanin e të dhënave. Për mendimin tim, është më e përshtatshme t'i shikosh këto statistika në ESXTOP, të paktën bazuar në faktin se periudha minimale e matjes atje është 2 sekonda.

Në seksionin Disk ka metrika në pajisjet bllok që përdoren nga VM. Ekzistojnë numërues për IOPS të tipit përmbledhës (numri i operacioneve hyrëse/dalëse gjatë periudhës së matjes) dhe disa numërues që lidhen me aksesin në bllok (Komandat e ndërprera, Rivendosja e autobusit). Sipas mendimit tim, është gjithashtu më i përshtatshëm për të parë këtë informacion në ESXTOP.

seksion Disku virtual – më e dobishme nga pikëpamja e gjetjes së problemeve të performancës së nënsistemit të diskut VM. Këtu mund të shihni performancën për çdo disk virtual. Është ky informacion që nevojitet për të kuptuar nëse një makinë virtuale e caktuar ka një problem. Përveç numëruesve standardë për numrin e operacioneve I/O, volumin e leximit/shkrimit dhe vonesave, ky seksion përmban numërues të dobishëm që tregojnë madhësinë e bllokut: Madhësia e kërkesës për leximin/shkrimin.

Në foton më poshtë është një grafik i performancës së diskut VM, ku mund të shihni numrin e IOPS, vonesën dhe madhësinë e bllokut. 

Analiza e performancës së VM në VMware vSphere. Pjesa 3: Magazinimi

Ju gjithashtu mund të shikoni matjet e performancës për të gjithë dyqanin e të dhënave nëse SIOC është i aktivizuar. Këtu janë informacionet bazë për vonesën mesatare dhe IOPS. Si parazgjedhje, ky informacion mund të shikohet vetëm në kohë reale.

Analiza e performancës së VM në VMware vSphere. Pjesa 3: Magazinimi

ESXTOP

ESXTOP ka disa ekrane që ofrojnë informacion mbi nënsistemin e diskut pritës në tërësi, makinat virtuale individuale dhe disqet e tyre.

Le të fillojmë me informacionin mbi makinat virtuale. Ekrani "Disk VM" thirret me tastin "v":

Analiza e performancës së VM në VMware vSphere. Pjesa 3: Magazinimi

NVDISK është numri i disqeve VM. Për të parë informacionin për çdo disk, shtypni "e" dhe futni GID-në e VM-së së interesit.

Kuptimi i parametrave të mbetur në këtë ekran është i qartë nga emrat e tyre.

Një tjetër ekran i dobishëm gjatë zgjidhjes së problemeve është përshtatësi i diskut. Thirret me tastin "d" (fushat A,B,C,D,E,G janë zgjedhur në foton më poshtë):

Analiza e performancës së VM në VMware vSphere. Pjesa 3: Magazinimi

NPTH – numri i shtigjeve drejt hënave që janë të dukshme nga ky përshtatës. Për të marrë informacion për secilën shteg në përshtatës, shtypni "e" dhe shkruani emrin e përshtatësit:

Analiza e performancës së VM në VMware vSphere. Pjesa 3: Magazinimi

AQLEN – Madhësia maksimale e radhës në përshtatës.

Gjithashtu në këtë ekran janë numëruesit e vonesave për të cilat fola më lart: KAVG/cmd, GAVG/cmd, DAVG/cmd, QAVG/cmd.

Ekrani i pajisjes Disk, i cili thirret duke shtypur tastin "u", jep informacion për pajisjet individuale të bllokut - hënat (fushat A, B, F, G, I janë zgjedhur në foton më poshtë). Këtu mund të shihni statusin e radhës për hënat.

Analiza e performancës së VM në VMware vSphere. Pjesa 3: Magazinimi

DQLEN – madhësia e radhës për një pajisje bllok.
ACTV – numri i komandave I/O në kernelin ESXi.
QUED – numri i komandave I/O në radhë.
%USD – ACTV / DQLEN × 100%.
LOAD – (ACTV + QUED) / DQLEN.

Nëse %USD është e lartë, duhet të konsideroni rritjen e radhës. Sa më shumë komanda në radhë, aq më i lartë është QAVG dhe, në përputhje me rrethanat, KAVG.

Mund të shihni gjithashtu në ekranin e pajisjes Disk nëse VAAI (vStorage API për Integrimin e Array) po funksionon në sistemin e ruajtjes. Për ta bërë këtë, zgjidhni fushat A dhe O.

Mekanizmi VAAI ju lejon të transferoni një pjesë të punës nga hipervizori direkt në sistemin e ruajtjes, për shembull, zero, kopjimin e blloqeve ose bllokimin.

Analiza e performancës së VM në VMware vSphere. Pjesa 3: Magazinimi

Siç mund ta shihni në foton e mësipërme, VAAI punon në këtë sistem ruajtjeje: primitivet Zero dhe ATS përdoren në mënyrë aktive.

Këshilla për optimizimin e punës me nënsistemin e diskut në ESXi

  • Kushtojini vëmendje madhësisë së bllokut.
  • Vendosni madhësinë optimale të radhës në HBA.
  • Mos harroni të aktivizoni SIOC në dyqanet e të dhënave.
  • Zgjidhni një PSP në përputhje me rekomandimet e prodhuesit të sistemit të ruajtjes.
  • Sigurohuni që VAAI po funksionon.

Artikuj të dobishëm të lidhura:http://www.yellow-bricks.com/2011/06/23/disk-schednumreqoutstanding-the-story/
http://www.yellow-bricks.com/2009/09/29/whats-that-alua-exactly/
http://www.yellow-bricks.com/2019/03/05/dqlen-changes-what-is-going-on/
https://www.codyhosterman.com/2017/02/understanding-vmware-esxi-queuing-and-the-flasharray/
https://www.codyhosterman.com/2018/03/what-is-the-latency-stat-qavg/
https://kb.vmware.com/s/article/1267
https://kb.vmware.com/s/article/1268
https://kb.vmware.com/s/article/1027901
https://kb.vmware.com/s/article/2069356
https://kb.vmware.com/s/article/2053628
https://kb.vmware.com/s/article/1003469
https://www.vmware.com/content/dam/digitalmarketing/vmware/en/pdf/techpaper/performance/vsphere-esxi-vcenter-server-67-performance-best-practices.pdf

Burimi: www.habr.com

Shto një koment