VM prestasie-analise in VMware vSphere. Deel 3: Berging

VM prestasie-analise in VMware vSphere. Deel 3: Berging

Deel 1. Oor die SVE
Deel 2. Oor geheue

Vandag sal ons die statistieke van die skyfsubstelsel in vSphere ontleed. 'n Bergingsprobleem is die mees algemene rede vir 'n stadige virtuele masjien. As, in die geval van SVE en RAM, foutsporing op die hipervisor-vlak eindig, as daar probleme met die skyf is, moet jy dalk met die datanetwerk en bergingstelsel te doen kry.

Ek sal die onderwerp bespreek deur die voorbeeld van blokkeertoegang tot bergingstelsels te gebruik, alhoewel vir lêertoegang die tellers ongeveer dieselfde is.

'N bietjie teorie

Wanneer daar gepraat word oor die werkverrigting van die skyfsubstelsel van virtuele masjiene, gee mense gewoonlik aandag aan drie onderling verwante parameters:

  • aantal toevoer/afvoerbewerkings (Inset/uitsetbewerkings per sekonde, IOPS);
  • deurset;
  • vertraging van toevoer/afvoerbewerkings (Latency).

Aantal IOPS gewoonlik belangrik vir ewekansige werkladings: toegang tot skyfblokke wat op verskillende plekke geleë is. 'n Voorbeeld van so 'n vrag kan databasisse, besigheidstoepassings (ERP, CRM), ens.

deurset belangrik vir opeenvolgende vragte: toegang tot blokke wat een na die ander geleë is. Byvoorbeeld, lêerbedieners (maar nie altyd nie) en video-toesigstelsels kan so 'n las genereer.

Deurvoer is soos volg verwant aan die aantal I/O-bewerkings:

Deurset = IOPS * Blokgrootte, waar Blokgrootte die blokgrootte is.

Blokgrootte is 'n redelik belangrike eienskap. Moderne weergawes van ESXi laat blokke tot 32 767 KB groot toe. As die blok selfs groter is, word dit in verskeie verdeel. Nie alle bergingstelsels kan doeltreffend met sulke groot blokke werk nie, so daar is 'n DiskMaxIOSize-parameter in ESXi Advanced Settings. Deur dit te gebruik, kan u die maksimum blokgrootte verminder wat deur die hipervisor oorgeslaan word (meer besonderhede hier). Voordat u hierdie parameter verander, beveel ek aan dat u met die stoorstelselvervaardiger konsulteer of ten minste die veranderinge op 'n laboratoriumbank toets. 

’n Groot blokgrootte kan ’n nadelige uitwerking op bergingsprestasie hê. Selfs al is die aantal IOPS en deurset relatief klein, kan hoë latensies waargeneem word met 'n groot blokgrootte. Let dus op hierdie parameter.

latency – die interessantste prestasieparameter. Die I/O latency vir 'n virtuele masjien bestaan ​​uit:

  • vertragings binne die hipervisor (KAVG, Average Kernel MilliSec/Read);
  • vertraging verskaf deur die datanetwerk en bergingstelsel (DAVG, Average Driver MilliSec/Command).

Die totale latensie wat in die gas-bedryfstelsel sigbaar is (GAVG, Average Guest MilliSec/Command) is die som van KAVG en DAVG.

GAVG en DAVG word gemeet en KAVG word bereken: GAVG–DAVG.

VM prestasie-analise in VMware vSphere. Deel 3: Berging
Bron

Kom ons kyk van naderby KAVG. Tydens normale werking moet KAVG neig na nul of ten minste baie minder as DAVG wees. Die enigste geval wat ek weet van waar KAVG na verwagting hoog is, is die IOPS-limiet op die VM-skyf. In hierdie geval, wanneer jy probeer om die limiet te oorskry, sal KAVG toeneem.

Die belangrikste komponent van KAVG is QAVG - die verwerkingswagtyd in die hipervisor. Die oorblywende komponente van KAVG is weglaatbaar.

Die tou in die skyfadapterbestuurder en die tou na die mane het 'n vaste grootte. Vir hoogs gelaaide omgewings kan dit nuttig wees om hierdie grootte te vergroot. Hier beskryf hoe om die toue in die adapterbestuurder te vergroot (terselfdertyd sal die tou na die mane toeneem). Hierdie instelling werk wanneer slegs een VM met die maan werk, wat skaars is. As daar verskeie VM's op die maan is, moet jy ook die parameter verhoog Disk.SchedNumReqUitstaande (instruksies  hier). Deur die tou te vergroot, verminder jy QAVG en KAVG onderskeidelik.

Maar weer, lees eers die dokumentasie van die HBA-verskaffer en toets die veranderinge op 'n laboratoriumbank.

Die grootte van die tou na die maan kan beïnvloed word deur die insluiting van die SIOC (Storage I/O Control) meganisme. Dit bied eenvormige toegang tot die maan vanaf alle bedieners in die groepering deur die tou na die maan op die bedieners dinamies te verander. Dit wil sê, as een van die gashere 'n VM bestuur wat 'n buitensporige hoeveelheid werkverrigting vereis (raasagtige buur-VM), verminder SIOC die toulengte na die maan op hierdie gasheer (DQLEN). Meer besonderhede hier.

Ons het KAVG uitgesorteer, nou 'n bietjie oor DAVG. Alles is eenvoudig hier: DAVG is die vertraging wat deur die eksterne omgewing (datanetwerk en bergingstelsel) ingestel word. Elke moderne en nie so moderne bergingstelsel het sy eie prestasietellers. Om probleme met DAVG te ontleed, maak dit sin om daarna te kyk. As alles goed is aan die ESXi- en bergingskant, gaan die datanetwerk na.

Om prestasieprobleme te vermy, kies die korrekte Path Selection Policy (PSP) vir jou bergingstelsel. Byna alle moderne bergingstelsels ondersteun PSP Round-Robin (met of sonder ALUA, asimmetriese logiese eenheidtoegang). Hierdie beleid laat jou toe om alle beskikbare paaie na die bergingstelsel te gebruik. In die geval van ALUA word slegs die paaie na die beheerder wat die maan besit, gebruik. Nie alle bergingstelsels op ESXi het verstekreëls wat die Round-Robin-beleid stel nie. As daar geen reël vir jou bergingstelsel is nie, gebruik 'n inprop van die stoorstelselvervaardiger, wat 'n ooreenstemmende reël op alle gashere in die groepie sal skep, of skep self 'n reël. Besonderhede hier

Sommige stoorstelselvervaardigers beveel ook aan om die aantal IOPS per pad van die standaardwaarde van 1000 na 1 te verander. In ons praktyk het dit dit moontlik gemaak om meer werkverrigting uit die stoorstelsel te "druk" en die tyd wat nodig is vir failover aansienlik te verminder in die geval van 'n beheerder mislukking of opdatering. Gaan die verkoper se aanbevelings na, en as daar geen kontraindikasies is nie, probeer om hierdie parameter te verander. Besonderhede hier.

Basiese virtuele masjien skyf substelsel werkverrigting tellers

Skyf substelsel werkverrigting tellers in vCenter word versamel in die Datastore, Disk, Virtual Disk afdelings:

VM prestasie-analise in VMware vSphere. Deel 3: Berging

In artikel Datastoor daar is maatstawwe vir vSphere-skyfbergings (datastore) waarop die VM-skywe geleë is. Hier sal jy standaard tellers vind vir:

  • IOPS (Gemiddelde lees/skryf versoeke per sekonde), 
  • deurset (lees/skryftempo), 
  • vertragings (Lees/Skryf/Hoogste latensie).

In beginsel is alles duidelik uit die name van die tellers. Laat ek u aandag weereens daarop vestig dat die statistieke hier nie vir 'n spesifieke VM (of VM-skyf) is nie, maar algemene statistieke vir die hele datastoor. Na my mening is dit geriefliker om na hierdie statistieke in ESXTOP te kyk, ten minste gebaseer op die feit dat die minimum metingstydperk daar 2 sekondes is.

In artikel Skyf daar is maatstawwe op bloktoestelle wat deur die VM gebruik word. Daar is tellers vir IOPS van die opsommingstipe (die aantal toevoer/afvoerbewerkings gedurende die metingsperiode) en verskeie tellers wat verband hou met blokkeringstoegang (Opdragte geaborteer, Bus-terugstellings). Na my mening is dit ook geriefliker om hierdie inligting in ESXTOP te sien.

artikel Virtuele skyf – die nuttigste uit die oogpunt van die vind van prestasieprobleme van die VM-skyfsubstelsel. Hier kan jy die werkverrigting vir elke virtuele skyf sien. Dit is hierdie inligting wat nodig is om te verstaan ​​of 'n spesifieke virtuele masjien 'n probleem het. Benewens die standaardtellers vir die aantal I/O-bewerkings, lees/skryfvolume en vertragings, bevat hierdie afdeling nuttige tellers wat die blokgrootte wys: Lees/Skryfversoekgrootte.

In die prentjie hieronder is 'n grafiek van VM-skyfwerkverrigting, waar jy die aantal IOPS, latensie en blokgrootte kan sien. 

VM prestasie-analise in VMware vSphere. Deel 3: Berging

U kan ook prestasiestatistieke vir die hele datastoor sien as SIOC geaktiveer is. Hier is basiese inligting oor gemiddelde Latency en IOPS. By verstek kan hierdie inligting slegs intyds bekyk word.

VM prestasie-analise in VMware vSphere. Deel 3: Berging

ESXTOP

ESXTOP het verskeie skerms wat inligting verskaf oor die gasheerskyfsubstelsel as geheel, individuele virtuele masjiene en hul skywe.

Kom ons begin met inligting oor virtuele masjiene. Die "Disk VM" skerm word opgeroep met die "v" sleutel:

VM prestasie-analise in VMware vSphere. Deel 3: Berging

NVDISK is die aantal VM-skywe. Om inligting vir elke skyf te sien, druk "e" en voer die GID van die VM van belang in.

Die betekenis van die oorblywende parameters op hierdie skerm is duidelik uit hul name.

Nog 'n nuttige skerm wanneer u probleme oplos, is skyfadapter. Geroep deur die "d" sleutel (velde A,B,C,D,E,G word in die prentjie hieronder gekies):

VM prestasie-analise in VMware vSphere. Deel 3: Berging

NPTH – die aantal paaie na die mane wat vanaf hierdie adapter sigbaar is. Om inligting vir elke pad op die adapter te kry, druk "e" en voer die naam van die adapter in:

VM prestasie-analise in VMware vSphere. Deel 3: Berging

AQLEN – maksimum tougrootte op die adapter.

Ook op hierdie skerm is die vertragingstellers waaroor ek hierbo gepraat het: KAVG/cmd, GAVG/cmd, DAVG/cmd, QAVG/cmd.

Die skyftoestelskerm, wat opgeroep word deur die “u”-sleutel te druk, verskaf inligting oor individuele bloktoestelle - mane (velde A, B, F, G, I word in die prentjie hieronder gekies). Hier kan jy die status van die tou vir die mane sien.

VM prestasie-analise in VMware vSphere. Deel 3: Berging

DQLEN – tougrootte vir 'n bloktoestel.
ACTV – aantal I/O-opdragte in die ESXi-kern.
QUED – aantal I/O-opdragte in die tou.
%USD – ACTV / DQLEN × 100%.
LOAD – (ACTV + QUED) / DQLEN.

As %USD hoog is, moet jy dit oorweeg om die tou te vergroot. Hoe meer opdragte in die tou is, hoe hoër is die QAVG en dienooreenkomstig die KAVG.

U kan ook op die skyftoestelskerm sien of VAAI (vStorage API for Array Integration) op die bergingstelsel loop. Om dit te doen, kies velde A en O.

Die VAAI-meganisme laat jou toe om 'n deel van die werk van die hipervisor direk na die stoorstelsel oor te dra, byvoorbeeld nulstelling, kopiëring van blokke of blokkering.

VM prestasie-analise in VMware vSphere. Deel 3: Berging

Soos u in die prentjie hierbo kan sien, werk VAAI op hierdie bergingstelsel: Nul- en ATS-primitiewe word aktief gebruik.

Wenke vir die optimalisering van werk met die skyfsubstelsel op ESXi

  • Gee aandag aan die blokgrootte.
  • Stel die optimale tougrootte op die HBA.
  • Moenie vergeet om SIOC op datawinkels te aktiveer nie.
  • Kies 'n PSP in ooreenstemming met die stoorstelselvervaardiger se aanbevelings.
  • Maak seker dat VAAI werk.

Nuttige Verwante Artikels:http://www.yellow-bricks.com/2011/06/23/disk-schednumreqoutstanding-the-story/
http://www.yellow-bricks.com/2009/09/29/whats-that-alua-exactly/
http://www.yellow-bricks.com/2019/03/05/dqlen-changes-what-is-going-on/
https://www.codyhosterman.com/2017/02/understanding-vmware-esxi-queuing-and-the-flasharray/
https://www.codyhosterman.com/2018/03/what-is-the-latency-stat-qavg/
https://kb.vmware.com/s/article/1267
https://kb.vmware.com/s/article/1268
https://kb.vmware.com/s/article/1027901
https://kb.vmware.com/s/article/2069356
https://kb.vmware.com/s/article/2053628
https://kb.vmware.com/s/article/1003469
https://www.vmware.com/content/dam/digitalmarketing/vmware/en/pdf/techpaper/performance/vsphere-esxi-vcenter-server-67-performance-best-practices.pdf

Bron: will.com

Voeg 'n opmerking