Dadansoddiad perfformiad VM yn VMware vSphere. Rhan 3: Storio

Dadansoddiad perfformiad VM yn VMware vSphere. Rhan 3: Storio

Rhan 1. Am y CPU
Rhan 2. Am Cofiant

Heddiw, byddwn yn dadansoddi metrigau'r is-system ddisg yn vSphere. Problem storio yw'r rheswm mwyaf cyffredin dros beiriant rhithwir araf. Os, yn achos CPU a RAM, mae datrys problemau yn dod i ben ar y lefel hypervisor, yna os oes problemau gyda'r ddisg, efallai y bydd yn rhaid i chi ddelio â'r rhwydwaith data a'r system storio.

Byddaf yn trafod y pwnc gan ddefnyddio'r enghraifft o fynediad bloc i systemau storio, er ar gyfer mynediad ffeiliau mae'r cownteri tua'r un peth.

Darn o theori

Wrth siarad am berfformiad yr is-system ddisg o beiriannau rhithwir, mae pobl fel arfer yn talu sylw i dri pharamedr cydgysylltiedig:

  • nifer y gweithrediadau mewnbwn/allbwn (Gweithrediadau Mewnbwn/Allbwn yr Eiliad, IOPS);
  • trwybwn;
  • oedi o ran gweithrediadau mewnbwn/allbwn (Latency).

Nifer yr IOPS fel arfer yn bwysig ar gyfer llwythi gwaith ar hap: mynediad i flociau disg wedi'u lleoli mewn gwahanol leoedd. Enghraifft o lwyth o'r fath fyddai cronfeydd data, cymwysiadau busnes (ERP, CRM), ac ati.

Lled band pwysig ar gyfer llwythi dilyniannol: mynediad i flociau wedi'u lleoli un ar ôl y llall. Er enghraifft, gall gweinyddwyr ffeiliau (ond nid bob amser) a systemau gwyliadwriaeth fideo gynhyrchu llwyth o'r fath.

Mae trwybwn yn gysylltiedig â nifer y gweithrediadau I/O fel a ganlyn:

Trwybwn = IOPS * Maint bloc, lle maint Bloc yw maint y bloc.

Mae maint bloc yn nodwedd eithaf pwysig. Mae fersiynau modern o ESXi yn caniatáu blociau hyd at 32 KB o faint. Os yw'r bloc hyd yn oed yn fwy, caiff ei rannu'n sawl un. Ni all pob system storio weithio'n effeithlon gyda blociau mor fawr, felly mae paramedr DiskMaxIOSize yng Ngosodiadau Uwch ESXi. Gan ei ddefnyddio, gallwch leihau maint bloc uchaf a hepgorwyd gan yr hypervisor (mwy o fanylion yma). Cyn newid y paramedr hwn, rwy'n argymell eich bod yn ymgynghori â gwneuthurwr y system storio neu o leiaf yn profi'r newidiadau ar fainc labordy. 

Gall maint bloc mawr gael effaith andwyol ar berfformiad storio. Hyd yn oed os yw nifer yr IOPS a'r trwybwn yn gymharol fach, gellir arsylwi cuddni uchel gyda maint bloc mawr. Felly, rhowch sylw i'r paramedr hwn.

latency - y paramedr perfformiad mwyaf diddorol. Mae hwyrni I/O ar gyfer peiriant rhithwir yn cynnwys:

  • oedi y tu mewn i'r hypervisor (KAVG, Average Kernel MilliSec/Read);
  • oedi a ddarperir gan y rhwydwaith data a'r system storio (DAVG, Average Driver MilliSec/Command).

Cyfanswm yr hwyrni sydd i'w weld yn yr OS gwadd (GAVG, Average Guest MilliSec/Command) yw swm KAVG a DAVG.

Mesurir GAVG a DAVG a chyfrifir KAVG: GAVG–DAVG.

Dadansoddiad perfformiad VM yn VMware vSphere. Rhan 3: Storio
Ffynhonnell

Gadewch i ni edrych yn agosach ar KAVG. Yn ystod gweithrediad arferol, dylai KAVG dueddu i sero neu o leiaf fod yn llawer llai na DAVG. Yr unig achos rwy'n ei wybod lle mae KAVG yn ddisgwyliedig o uchel yw'r terfyn IOPS ar y ddisg VM. Yn yr achos hwn, pan geisiwch fynd y tu hwnt i'r terfyn, bydd KAVG yn cynyddu.

Elfen fwyaf arwyddocaol KAVG yw QAVG - yr amser ciw prosesu y tu mewn i'r hypervisor. Mae gweddill cydrannau KAVG yn ddibwys.

Mae gan y ciw yn y gyrrwr addasydd disg a'r ciw i'r lleuadau faint sefydlog. Ar gyfer amgylcheddau llwythog iawn, gall fod yn ddefnyddiol cynyddu'r maint hwn. Yma yn disgrifio sut i gynyddu'r ciwiau yn y gyrrwr addasydd (ar yr un pryd bydd y ciw i'r lleuadau yn cynyddu). Mae'r gosodiad hwn yn gweithio pan mai dim ond un VM sy'n gweithio gyda'r lleuad, sy'n brin. Os oes sawl VM ar y lleuad, rhaid i chi hefyd gynyddu'r paramedr Disg.SchedNumReqOutstanding (cyfarwyddiadau  yma). Trwy gynyddu'r ciw, rydych chi'n lleihau QAVG a KAVG yn y drefn honno.

Ond eto, darllenwch y ddogfennaeth gan y gwerthwr HBA yn gyntaf a phrofwch y newidiadau ar fainc labordy.

Gall cynnwys y mecanwaith SIOC (Rheolaeth Storio I/O) effeithio ar faint y ciw i'r lleuad. Mae'n darparu mynediad unffurf i'r lleuad o bob gweinydd yn y clwstwr trwy newid y ciw i'r lleuad ar y gweinyddwyr yn ddeinamig. Hynny yw, os yw un o'r gwesteiwyr yn rhedeg VM sy'n gofyn am swm anghymesur o berfformiad (cymydog swnllyd VM), mae SIOC yn lleihau hyd y ciw i'r lleuad ar y gwesteiwr hwn (DQLEN). Mwy o fanylion yma.

Rydyn ni wedi rhoi trefn ar KAVG, nawr ychydig o gwmpas DAVG. Mae popeth yn syml yma: DAVG yw'r oedi a gyflwynir gan yr amgylchedd allanol (rhwydwaith data a system storio). Mae gan bob system storio fodern ac nid mor fodern ei chownteri perfformiad ei hun. I ddadansoddi problemau gyda DAVG, mae'n gwneud synnwyr edrych arnynt. Os yw popeth yn iawn ar yr ochr ESXi a storio, gwiriwch y rhwydwaith data.

Er mwyn osgoi problemau perfformiad, dewiswch y Polisi Dewis Llwybr (PSP) cywir ar gyfer eich system storio. Mae bron pob system storio fodern yn cefnogi PSP Rownd-Robin (gyda neu heb ALUA, Mynediad Uned Rhesymegol Anghymesur). Mae'r polisi hwn yn caniatáu ichi ddefnyddio'r holl lwybrau sydd ar gael i'r system storio. Yn achos ALUA, dim ond y llwybrau i'r rheolydd sy'n berchen ar y lleuad a ddefnyddir. Nid oes gan bob system storio ar ESXi reolau diofyn sy'n gosod y polisi Rownd-Robin. Os nad oes rheol ar gyfer eich system storio, defnyddiwch ategyn gan wneuthurwr y system storio, a fydd yn creu rheol gyfatebol ar bob gwesteiwr yn y clwstwr, neu greu rheol eich hun. Manylion yma

Hefyd, mae rhai gweithgynhyrchwyr systemau storio yn argymell newid nifer yr IOPS fesul llwybr o'r gwerth safonol o 1000 i 1. Yn ein harfer, roedd hyn yn ei gwneud hi'n bosibl “gwasgu” mwy o berfformiad allan o'r system storio a lleihau'n sylweddol yr amser sydd ei angen ar gyfer methiant mewn achos o fethiant rheolwr neu ddiweddariad. Gwiriwch argymhellion y gwerthwr, ac os nad oes unrhyw wrtharwyddion, ceisiwch newid y paramedr hwn. Manylion yma.

Cownteri perfformiad is-system disg peiriant rhithwir sylfaenol

Cesglir cownteri perfformiad is-system disg yn vCenter yn yr adrannau Datastore, Disk, Virtual Disk:

Dadansoddiad perfformiad VM yn VMware vSphere. Rhan 3: Storio

Yn adran Storfa Ddata mae metrigau ar gyfer storfeydd disg vSphere (storfeydd data) y mae'r disgiau VM wedi'u lleoli arnynt. Yma fe welwch gownteri safonol ar gyfer:

  • IOPS (Ceisiadau darllen/ysgrifennu cyfartalog yr eiliad), 
  • trwybwn (cyfradd Darllen/Ysgrifennu), 
  • oedi (Darllen/Ysgrifennu/Cuddfanc uchaf).

Mewn egwyddor, mae popeth yn glir o enwau'r cownteri. Gadewch imi dynnu eich sylw unwaith eto at y ffaith nad yw'r ystadegau yma ar gyfer VM penodol (neu ddisg VM), ond ystadegau cyffredinol ar gyfer y storfa ddata gyfan. Yn fy marn i, mae'n fwy cyfleus edrych ar yr ystadegau hyn yn ESXTOP, o leiaf yn seiliedig ar y ffaith bod y cyfnod mesur lleiaf yn 2 eiliad.

Yn adran Disg mae metrigau ar ddyfeisiau bloc a ddefnyddir gan y VM. Mae cownteri ar gyfer IOPS o'r math o grynodeb (nifer y gweithrediadau mewnbwn/allbwn yn ystod y cyfnod mesur) a sawl rhifydd yn ymwneud â mynediad bloc (Gorchmynion wedi'u dileu, ailosodiadau bysiau). Yn fy marn i, mae hefyd yn fwy cyfleus i weld y wybodaeth hon yn ESXTOP.

Adran Disg Rhithwir – y mwyaf defnyddiol o safbwynt dod o hyd i broblemau perfformiad yr is-system ddisg VM. Yma gallwch weld perfformiad pob disg rhithwir. Y wybodaeth hon sydd ei hangen i ddeall a oes gan beiriant rhithwir penodol broblem. Yn ogystal â'r cownteri safonol ar gyfer nifer y gweithrediadau I/O, darllen/ysgrifennu cyfaint ac oedi, mae'r adran hon yn cynnwys rhifyddion defnyddiol sy'n dangos maint y bloc: Darllen/Ysgrifennu maint y cais.

Yn y llun isod mae graff o berfformiad disg VM, lle gallwch weld nifer yr IOPS, latency a maint bloc. 

Dadansoddiad perfformiad VM yn VMware vSphere. Rhan 3: Storio

Gallwch hefyd weld metrigau perfformiad ar gyfer y storfa ddata gyfan os yw SIOC wedi'i alluogi. Dyma wybodaeth sylfaenol am Latency cyfartalog ac IOPS. Yn ddiofyn, dim ond mewn amser real y gellir gweld y wybodaeth hon.

Dadansoddiad perfformiad VM yn VMware vSphere. Rhan 3: Storio

ESXTOP

Mae gan ESXTOP sawl sgrin sy'n darparu gwybodaeth ar yr is-system disg gwesteiwr yn ei chyfanrwydd, peiriannau rhithwir unigol a'u disgiau.

Gadewch i ni ddechrau gyda gwybodaeth am beiriannau rhithwir. Mae'r sgrin “Disk VM” yn cael ei galw i fyny gyda'r allwedd “v”:

Dadansoddiad perfformiad VM yn VMware vSphere. Rhan 3: Storio

NVDISK yw nifer y disgiau VM. I weld gwybodaeth ar gyfer pob disg, pwyswch “e” a rhowch GID y VM o ddiddordeb.

Mae ystyr y paramedrau sy'n weddill ar y sgrin hon yn glir o'u henwau.

Sgrin ddefnyddiol arall wrth ddatrys problemau yw addasydd Disg. Wedi'i alw gan yr allwedd “d” (mae meysydd A, B, C, D, E, G yn cael eu dewis yn y llun isod):

Dadansoddiad perfformiad VM yn VMware vSphere. Rhan 3: Storio

NPTH - nifer y llwybrau i'r lleuadau sy'n weladwy o'r addasydd hwn. I gael gwybodaeth am bob llwybr ar yr addasydd, pwyswch “e” a rhowch enw'r addasydd:

Dadansoddiad perfformiad VM yn VMware vSphere. Rhan 3: Storio

AQLEN – uchafswm maint y ciw ar yr addasydd.

Hefyd ar y sgrin hon mae'r cownteri oedi y soniais amdanynt uchod: KAVG/cmd, GAVG/cmd, DAVG/cmd, QAVG/cmd.

Mae'r sgrin dyfais Disg, sy'n cael ei alw i fyny trwy wasgu'r allwedd “u”, yn darparu gwybodaeth am ddyfeisiau bloc unigol - lleuadau (mae meysydd A, B, F, G, rwy'n cael eu dewis yn y llun isod). Yma gallwch weld statws y ciw ar gyfer y lleuadau.

Dadansoddiad perfformiad VM yn VMware vSphere. Rhan 3: Storio

DQLEN – maint ciw ar gyfer dyfais bloc.
ACTV – nifer y gorchmynion I/O yn y cnewyllyn ESXi.
QUED – nifer y gorchmynion I/O yn y ciw.
%DOLER YR UDA – ACTV / DQLEN × 100%.
LOAD – (ACTV + QUED) / DQLEN.

Os yw % USD yn uchel, dylech ystyried cynyddu'r ciw. Po fwyaf o orchmynion yn y ciw, yr uchaf yw'r QAVG ac, yn unol â hynny, y KAVG.

Gallwch hefyd weld ar sgrin y ddyfais Disg a yw VAAI (vStorage API ar gyfer Integreiddio Array) yn rhedeg ar y system storio. I wneud hyn, dewiswch feysydd A ac O.

Mae'r mecanwaith VAAI yn caniatáu ichi drosglwyddo rhan o'r gwaith o'r hypervisor yn uniongyrchol i'r system storio, er enghraifft, sero, copïo blociau neu rwystro.

Dadansoddiad perfformiad VM yn VMware vSphere. Rhan 3: Storio

Fel y gwelwch yn y llun uchod, mae VAAI yn gweithio ar y system storio hon: mae primitives sero ac ATS yn cael eu defnyddio'n weithredol.

Awgrymiadau ar gyfer optimeiddio gwaith gyda'r is-system ddisg ar ESXi

  • Rhowch sylw i faint y bloc.
  • Gosodwch y maint ciw gorau posibl ar yr HBA.
  • Peidiwch ag anghofio galluogi SIOC ar storfeydd data.
  • Dewiswch raglen cymorth Bugeiliol yn unol ag argymhellion gwneuthurwr y system storio.
  • Sicrhewch fod VAAI yn gweithio.

Erthyglau defnyddiol ar y pwnc:http://www.yellow-bricks.com/2011/06/23/disk-schednumreqoutstanding-the-story/
http://www.yellow-bricks.com/2009/09/29/whats-that-alua-exactly/
http://www.yellow-bricks.com/2019/03/05/dqlen-changes-what-is-going-on/
https://www.codyhosterman.com/2017/02/understanding-vmware-esxi-queuing-and-the-flasharray/
https://www.codyhosterman.com/2018/03/what-is-the-latency-stat-qavg/
https://kb.vmware.com/s/article/1267
https://kb.vmware.com/s/article/1268
https://kb.vmware.com/s/article/1027901
https://kb.vmware.com/s/article/2069356
https://kb.vmware.com/s/article/2053628
https://kb.vmware.com/s/article/1003469
https://www.vmware.com/content/dam/digitalmarketing/vmware/en/pdf/techpaper/performance/vsphere-esxi-vcenter-server-67-performance-best-practices.pdf

Ffynhonnell: hab.com

Ychwanegu sylw