VM-i jõudluse analüüs rakenduses VMware vSphere. 3. osa: Säilitamine

VM-i jõudluse analüüs rakenduses VMware vSphere. 3. osa: Säilitamine

Osa 1. Teave protsessori kohta
2. osa. Mälu kohta

Täna analüüsime vSphere'i ketta alamsüsteemi mõõdikuid. Salvestusprobleem on aeglase virtuaalmasina kõige levinum põhjus. Kui protsessori ja RAM-i puhul lõppeb tõrkeotsing hüperviisori tasemel, siis kettaga seotud probleemide korral tuleb ehk tegeleda andmevõrgu ja salvestussüsteemiga.

Arutan teemat salvestussüsteemidele juurdepääsu blokeerimise näitel, kuigi failidele juurdepääsu puhul on loendurid ligikaudu samad.

Natuke teooriat

Virtuaalsete masinate ketta alamsüsteemi jõudlusest rääkides pööravad inimesed tavaliselt tähelepanu kolmele omavahel seotud parameetrile:

  • sisend/väljundoperatsioonide arv (Input/Output Operations Per Second, IOPS);
  • läbilaskevõime;
  • sisend/väljundoperatsioonide viivitus (latentsus).

IOPS-i arv tavaliselt oluline juhuslike töökoormuste jaoks: juurdepääs erinevates kohtades asuvatele kettaplokkidele. Sellise koormuse näiteks võivad olla andmebaasid, ärirakendused (ERP, CRM) jne.

Läbilaskevõime oluline järjestikuste koormuste jaoks: juurdepääs üksteise järel asuvatele plokkidele. Näiteks failiserverid (kuid mitte alati) ja videovalvesüsteemid võivad sellist koormust tekitada.

Läbilaskevõime on seotud I/O operatsioonide arvuga järgmiselt:

Läbilaskevõime = IOPS * Ploki suurus, kus Ploki suurus on ploki suurus.

Ploki suurus on üsna oluline omadus. ESXi kaasaegsed versioonid võimaldavad plokke suurusega kuni 32 767 KB. Kui plokk on veelgi suurem, jagatakse see mitmeks. Kõik salvestussüsteemid ei saa nii suurte plokkidega tõhusalt töötada, seetõttu on ESXi täpsemates sätetes parameeter DiskMaxIOSize. Seda kasutades saate vähendada hüperviisori poolt vahele jäetud maksimaalset ploki suurust (täpsemalt siin). Enne selle parameetri muutmist soovitan konsulteerida salvestussüsteemi tootjaga või vähemalt katsetada muudatusi laboratooriumis. 

Suur ploki suurus võib kahjustada salvestamise jõudlust. Isegi kui IOPS-i arv ja läbilaskevõime on suhteliselt väikesed, võib suure plokisuuruse korral täheldada suuri latentsusaega. Seetõttu pöörake sellele parameetrile tähelepanu.

Hilinemine – kõige huvitavam jõudlusparameeter. Virtuaalse masina I/O latentsusaeg koosneb järgmistest osadest:

  • viivitused hüperviisori sees (KAVG, Average Kernel MilliSec/Read);
  • viivitus, mille annab andmevõrk ja salvestussüsteem (DAVG, Average Driver MilliSec/Command).

Külalis-OS-is (GAVG, Average Guest MilliSec/Command) nähtav kogu latentsusaeg on KAVG ja DAVG summa.

Mõõdetakse GAVG ja DAVG ning arvutatakse KAVG: GAVG–DAVG.

VM-i jõudluse analüüs rakenduses VMware vSphere. 3. osa: Säilitamine
Allikas

Vaatame lähemalt KAVG. Tavalise töötamise ajal peaks KAVG kalduma nulli või vähemalt olema palju väiksem kui DAVG. Ainus juhtum, mida ma tean, kus KAVG on eeldatavasti kõrge, on VM-i ketta IOPS-i limiit. Sel juhul, kui proovite limiiti ületada, suureneb KAVG.

KAVG kõige olulisem komponent on QAVG – töötlemisjärjekorra aeg hüperviisori sees. Ülejäänud KAVG komponendid on tühised.

Järjekord kettaadapteri draiveris ja järjekord kuudesse on kindla suurusega. Väga koormatud keskkondade puhul võib olla kasulik seda suurust suurendada. see on kirjeldab, kuidas adapteri draiveris järjekordi suurendada (samal ajal suureneb järjekord kuudesse). See säte töötab siis, kui Kuuga töötab ainult üks virtuaalmasin, mis on haruldane. Kui Kuul on mitu VM-i, peate ka parameetrit suurendama Disk.SchedNumReqOutstanding (juhised  siin). Järjekorda suurendades vähendate vastavalt QAVG-d ja KAVG-d.

Kuid jällegi, lugege esmalt HBA müüja dokumentatsiooni ja katsetage muudatusi laboripingil.

Kuu järjekorra suurust võib mõjutada SIOC (Storage I/O Control) mehhanismi kaasamine. See tagab kõigi klastri serverite ühtse juurdepääsu Kuule, muutes serverites dünaamiliselt kuu järjekorda. See tähendab, et kui üks hostidest töötab VM-iga, mis nõuab ebaproportsionaalselt palju jõudlust (mürarikas naaber-VM), vähendab SIOC sellel hostil (DQLEN) järjekorra pikkust kuuni. Rohkem detaile siin.

Oleme KAVG lahendanud, nüüd natuke sellest DAVG. Siin on kõik lihtne: DAVG on väliskeskkonna (andmevõrgu ja salvestussüsteemi) poolt sisse viidud viivitus. Igal kaasaegsel ja mitte nii kaasaegsel salvestussüsteemil on oma jõudluse loendurid. DAVG-ga seotud probleemide analüüsimiseks on mõttekas neid vaadata. Kui ESXi ja salvestuse poolel on kõik korras, kontrollige andmevõrku.

Jõudlusprobleemide vältimiseks valige oma salvestussüsteemi jaoks õige tee valimise poliitika (PSP). Peaaegu kõik kaasaegsed salvestussüsteemid toetavad PSP Round-Robini (koos ALUA-ga või ilma, Asymmetric Logical Unit Access). See reegel võimaldab teil kasutada kõiki saadaolevaid salvestussüsteemi teid. ALUA puhul kasutatakse ainult kuu omava kontrolleri teid. Kõigil ESXi salvestussüsteemidel pole vaikereegleid, mis määravad Round-Robini poliitika. Kui teie salvestussüsteemi jaoks reeglit pole, kasutage salvestussüsteemi tootja pistikprogrammi, mis loob vastava reegli kõikidele klastri hostidele või loo ise reegel. Üksikasjad siin

Samuti soovitavad mõned salvestussüsteemide tootjad muuta IOPS-i arvu tee kohta standardväärtuselt 1000 1-le. Meie praktikas võimaldas see salvestussüsteemist rohkem jõudlust välja pigistada ja oluliselt vähendada tõrkevahetuseks kuluvat aega. kontrolleri rikke või värskenduse korral. Kontrollige müüja soovitusi ja kui vastunäidustusi pole, proovige seda parameetrit muuta. Üksikasjad siin.

Põhilised virtuaalse masina ketta alamsüsteemi jõudluse loendurid

Ketta alamsüsteemi jõudluse loendurid vCenteris kogutakse jaotistesse Andmesalve, Ketas, Virtuaalne ketas:

VM-i jõudluse analüüs rakenduses VMware vSphere. 3. osa: Säilitamine

Jaotises Andmepood vSphere'i kettamälude (andmesalvede) jaoks, millel VM-kettad asuvad, on olemas mõõdikud. Siit leiate standardsed loendurid:

  • IOPS (keskmised lugemis-/kirjutustaotlused sekundis), 
  • läbilaskevõime (lugemis-/kirjutuskiirus), 
  • viivitused (lugemine/kirjutamine/suurim latentsusaeg).

Põhimõtteliselt on loendurite nimedest kõik selge. Juhin veel kord teie tähelepanu asjaolule, et siinne statistika ei ole konkreetse VM-i (või VM-ketta) kohta, vaid üldine statistika kogu andmesalve kohta. Minu arust on seda statistikat mugavam vaadata ESXTOPis, vähemalt selle põhjal, et minimaalne mõõtmisperiood seal on 2 sekundit.

Jaotises Ketas plokkseadmete kohta on mõõdikuid, mida VM kasutab. Olemas on summeerimistüüpi IOPS-i loendurid (sisend/väljundoperatsioonide arv mõõtmisperioodi jooksul) ja mitmed blokeeringuga seotud loendurid (käsud katkestatud, siini lähtestamine). Minu meelest on seda infot ESXTOPis ka mugavam vaadata.

Lõik Virtuaalne ketas – VM-i ketta alamsüsteemi jõudlusprobleemide leidmise seisukohalt kõige kasulikum. Siin näete iga virtuaalse ketta jõudlust. Just seda teavet on vaja selleks, et mõista, kas konkreetses virtuaalmasinas on probleem. Lisaks standardsetele I/O-toimingute arvu, lugemis-/kirjutusmahu ja viivituste loenduritele sisaldab see jaotis kasulikke loendureid, mis näitavad ploki suurust: lugemise/kirjutamise päringu suurus.

Alloleval pildil on VM-i ketta jõudluse graafik, kus näete IOPS-i arvu, latentsust ja ploki suurust. 

VM-i jõudluse analüüs rakenduses VMware vSphere. 3. osa: Säilitamine

Kui SIOC on lubatud, saate vaadata ka kogu andmesalve jõudlusmõõdikuid. Siin on põhiteave keskmise latentsusaja ja IOPS-i kohta. Vaikimisi saab seda teavet vaadata ainult reaalajas.

VM-i jõudluse analüüs rakenduses VMware vSphere. 3. osa: Säilitamine

ESXTOP

ESXTOP-il on mitu ekraani, mis pakuvad teavet hostiketta alamsüsteemi kui terviku, üksikute virtuaalmasinate ja nende ketaste kohta.

Alustame teabega virtuaalmasinate kohta. Ekraan „Disk VM” kuvatakse klahvi „v” abil:

VM-i jõudluse analüüs rakenduses VMware vSphere. 3. osa: Säilitamine

NVDISK on VM-ketaste arv. Iga ketta teabe vaatamiseks vajutage "e" ja sisestage huvipakkuva VM-i GID.

Ülejäänud parameetrite tähendus sellel ekraanil selgub nende nimedest.

Veel üks kasulik ekraan tõrkeotsingul on kettaadapter. Kutsutakse klahviga d (alloleval pildil on valitud väljad A,B,C,D,E,G):

VM-i jõudluse analüüs rakenduses VMware vSphere. 3. osa: Säilitamine

NPTH – sellest adapterist nähtavate kuude poole suunduvate teede arv. Adapteri iga tee kohta teabe saamiseks vajutage "e" ja sisestage adapteri nimi:

VM-i jõudluse analüüs rakenduses VMware vSphere. 3. osa: Säilitamine

AQLEN – adapteri maksimaalne järjekorra suurus.

Sellel ekraanil on ka viivitusloendurid, millest ma eespool rääkisin: KAVG/cmd, GAVG/cmd, DAVG/cmd, QAVG/cmd.

Kettaseadme ekraan, mis avatakse klahvi “u” vajutamisega, annab teavet üksikute plokkseadmete - kuude kohta (alloleval pildil on valitud väljad A, B, F, G, I). Siit näed moonade järjekorra olekut.

VM-i jõudluse analüüs rakenduses VMware vSphere. 3. osa: Säilitamine

DQLEN – plokiseadme järjekorra suurus.
ACTV – ESXi tuuma I/O-käskude arv.
QUED – I/O käskude arv järjekorras.
%USD – ACTV / DQLEN × 100%.
LOAD – (ACTV + QUED) / DQLEN.

Kui %USD on kõrge, peaksite kaaluma järjekorra suurendamist. Mida rohkem käske järjekorras, seda kõrgem on QAVG ja vastavalt ka KAVG.

Samuti näete kettaseadme ekraanil, kas salvestussüsteemis töötab VAAI (vStorage API for Array Integration). Selleks valige väljad A ja O.

VAAI mehhanism võimaldab osa tööst hüperviisorist otse salvestussüsteemi üle kanda, näiteks nullida, plokke kopeerida või blokeerida.

VM-i jõudluse analüüs rakenduses VMware vSphere. 3. osa: Säilitamine

Nagu ülaloleval pildil näha, töötab VAAI selle salvestussüsteemi peal: aktiivselt kasutatakse null- ja ATS-primitiive.

Näpunäiteid ESXi ketta alamsüsteemiga töö optimeerimiseks

  • Pöörake tähelepanu ploki suurusele.
  • Määrake HBA-s optimaalne järjekorra suurus.
  • Ärge unustage lubada andmesalvedes SIOC-i.
  • Valige PSP vastavalt salvestussüsteemi tootja soovitustele.
  • Veenduge, et VAAI töötab.

Kasulikud artiklid teemal:http://www.yellow-bricks.com/2011/06/23/disk-schednumreqoutstanding-the-story/
http://www.yellow-bricks.com/2009/09/29/whats-that-alua-exactly/
http://www.yellow-bricks.com/2019/03/05/dqlen-changes-what-is-going-on/
https://www.codyhosterman.com/2017/02/understanding-vmware-esxi-queuing-and-the-flasharray/
https://www.codyhosterman.com/2018/03/what-is-the-latency-stat-qavg/
https://kb.vmware.com/s/article/1267
https://kb.vmware.com/s/article/1268
https://kb.vmware.com/s/article/1027901
https://kb.vmware.com/s/article/2069356
https://kb.vmware.com/s/article/2053628
https://kb.vmware.com/s/article/1003469
https://www.vmware.com/content/dam/digitalmarketing/vmware/en/pdf/techpaper/performance/vsphere-esxi-vcenter-server-67-performance-best-practices.pdf

Allikas: www.habr.com

Lisa kommentaar