Analiżi tal-prestazzjoni tal-VM f'VMware vSphere. Parti 3: Ħażna

Analiżi tal-prestazzjoni tal-VM f'VMware vSphere. Parti 3: Ħażna

Parti 1. Dwar is-CPU
Parti 2. Dwar il-Memorja

Illum se nanalizzaw il-metriċi tas-subsistema tad-disk f'vSphere. Problema tal-ħażna hija l-aktar raġuni komuni għal magna virtwali bil-mod. Jekk, fil-każ ta 'CPU u RAM, is-soluzzjoni tal-problemi tispiċċa fil-livell tal-hypervisor, allura jekk ikun hemm problemi bid-diska, jista' jkollok tittratta man-netwerk tad-dejta u s-sistema tal-ħażna.

Se niddiskuti s-suġġett billi tuża l-eżempju ta 'blokk aċċess għal sistemi ta' ħażna, għalkemm għall-aċċess għall-fajls il-counters huma bejn wieħed u ieħor l-istess.

Daqsxejn ta 'teorija

Meta titkellem dwar il-prestazzjoni tas-subsistema tad-disk tal-magni virtwali, in-nies normalment jagħtu attenzjoni għal tliet parametri interrelatati:

  • numru ta' operazzjonijiet ta' input/output (Operazzjonijiet ta' Input/Output Kull Sekonda, IOPS);
  • throughput;
  • dewmien ta' operazzjonijiet ta' input/output (Latency).

Numru ta' IOPS normalment importanti għal xogħol bl-addoċċ: aċċess għal blokki tad-disk li jinsabu f'postijiet differenti. Eżempju ta’ tagħbija bħal din jistgħu jkunu databases, applikazzjonijiet kummerċjali (ERP, CRM), eċċ.

Bandwidth importanti għal tagħbijiet sekwenzjali: aċċess għal blokki li jinsabu wieħed wara l-ieħor. Pereżempju, servers ta' fajls (iżda mhux dejjem) u sistemi ta' sorveljanza bil-vidjo jistgħu jiġġeneraw tagħbija bħal din.

It-throughput huwa relatat man-numru ta' operazzjonijiet I/O kif ġej:

Throughput = IOPS * Daqs tal-blokk, fejn Block size huwa d-daqs tal-blokk.

Id-daqs tal-blokk huwa karatteristika pjuttost importanti. Verżjonijiet moderni ta 'ESXi jippermettu blokki sa 32 KB fid-daqs. Jekk il-blokk huwa saħansitra akbar, huwa maqsum f'diversi. Mhux is-sistemi tal-ħażna kollha jistgħu jaħdmu b'mod effiċjenti ma 'blokki kbar bħal dawn, għalhekk hemm parametru DiskMaxIOSize fl-Issettjar Avvanzat ESXi. Meta tużaha, tista 'tnaqqas id-daqs massimu tal-blokk maqbeż mill-hypervisor (aktar dettalji hawn). Qabel ma tbiddel dan il-parametru, nirrakkomanda li tikkonsulta mal-manifattur tas-sistema tal-ħażna jew għall-inqas tittestja l-bidliet fuq bank tal-laboratorju. 

Daqs kbir ta 'blokk jista' jkollu effett detrimentali fuq il-prestazzjoni tal-ħażna. Anki jekk in-numru ta 'IOPS u throughput huma relattivament żgħar, jistgħu jiġu osservati latenzi għoljin b'daqs kbir ta' blokk. Għalhekk, agħti attenzjoni għal dan il-parametru.

Latenza – l-aktar parametru tal-prestazzjoni interessanti. Il-latency I/O għal magna virtwali tikkonsisti minn:

  • dewmien ġewwa l-hypervisor (KAVG, Average Kernel MilliSec/Read);
  • dewmien ipprovdut min-netwerk tad-dejta u s-sistema tal-ħażna (DAVG, Sewwieq Medji MilliSec/Kmand).

Il-latency totali li hija viżibbli fl-OS mistieden (GAVG, MilliSec/Kmand Mistiedna Medja) hija s-somma ta' KAVG u DAVG.

GAVG u DAVG huma mkejla u KAVG huwa kkalkulat: GAVG–DAVG.

Analiżi tal-prestazzjoni tal-VM f'VMware vSphere. Parti 3: Ħażna
Sors

Ejja nagħtu ħarsa aktar mill-qrib lejn KAVG. Waqt it-tħaddim normali, KAVG għandu t-tendenza għal żero jew għall-inqas ikun ħafna inqas minn DAVG. L-uniku każ li naf fejn KAVG huwa mistenni għoli huwa l-limitu IOPS fuq id-diska VM. F'dan il-każ, meta tipprova taqbeż il-limitu, KAVG se jiżdied.

L-aktar komponent sinifikanti ta 'KAVG huwa QAVG - il-ħin tal-kju tal-ipproċessar ġewwa l-hypervisor. Il-komponenti li fadal ta' KAVG huma negliġibbli.

Il-kju fis-sewwieq tal-adapter tad-disk u l-kju għall-qamar għandu daqs fiss. Għal ambjenti mgħobbija ħafna, jista 'jkun utli li jiżdied dan id-daqs. Hawnhekk jiddeskrivi kif iżżid il-kjuwijiet fis-sewwieq tal-adapter (fl-istess ħin il-kju għall-qamar jiżdied). Dan l-issettjar jaħdem meta VM waħda biss tkun qed taħdem mal-qamar, li huwa rari. Jekk hemm diversi VMs fuq il-qamar, trid iżżid ukoll il-parametru Disk.SchedNumReqOutstanding (struzzjonijiet  hawn). Billi żżid il-kju, tnaqqas QAVG u KAVG rispettivament.

Iżda għal darb'oħra, l-ewwel aqra d-dokumentazzjoni mill-bejjiegħ tal-HBA u ttestja l-bidliet fuq bank tal-laboratorju.

Id-daqs tal-kju għall-qamar jista 'jiġi affettwat mill-inklużjoni tal-mekkaniżmu SIOC (Storage I/O Control). Jipprovdi aċċess uniformi għall-qamar mis-servers kollha fil-cluster billi jbiddel dinamikament il-kju għall-qamar fuq is-servers. Jiġifieri, jekk wieħed mill-ospiti qed iħaddem VM li teħtieġ ammont sproporzjonat ta 'prestazzjoni (VM storbjuż tal-ġar), SIOC inaqqas it-tul tal-kju għall-qamar fuq dan il-host (DQLEN). Iktar dettalji hawn.

We've magħżula KAVG, issa ftit dwar DAVG. Hawnhekk kollox huwa sempliċi: DAVG huwa d-dewmien introdott mill-ambjent estern (netwerk tad-dejta u sistema ta 'ħażna). Kull sistema ta 'ħażna moderna u mhux daqshekk moderna għandha l-counters tal-prestazzjoni tagħha stess. Biex tanalizza l-problemi b'DAVG, jagħmel sens li tħares lejhom. Jekk kollox huwa tajjeb fuq in-naħa ESXi u l-ħażna, iċċekkja n-netwerk tad-dejta.

Biex tevita problemi ta' prestazzjoni, agħżel il-Politika tal-Għażla tal-Path (PSP) korretta għas-sistema tal-ħażna tiegħek. Kważi s-sistemi tal-ħażna moderni kollha jappoġġaw PSP Round-Robin (bi jew mingħajr ALUA, Asymmetric Logical Unit Access). Din il-politika tippermettilek tuża l-mogħdijiet kollha disponibbli għas-sistema tal-ħażna. Fil-każ ta 'ALUA, jintużaw biss il-mogħdijiet għall-kontrollur li għandu l-qamar. Mhux is-sistemi kollha ta 'ħażna fuq ESXi għandhom regoli default li jistabbilixxu l-politika Round-Robin. Jekk ma jkun hemm l-ebda regola għas-sistema tal-ħażna tiegħek, uża plugin mill-manifattur tas-sistema tal-ħażna, li toħloq regola korrispondenti fuq l-hosts kollha fil-cluster, jew toħloq regola lilek innifsek. Dettalji hawn

Ukoll, xi manifatturi tas-sistema tal-ħażna jirrakkomandaw li jinbidel in-numru ta 'IOPS għal kull mogħdija mill-valur standard ta' 1000 għal 1. Fil-prattika tagħna, dan għamilha possibbli li "jgħafas" aktar prestazzjoni mis-sistema tal-ħażna u jitnaqqas b'mod sinifikanti l-ħin meħtieġ għall-falliment. fil-każ ta' ħsara jew aġġornament tal-kontrollur. Iċċekkja r-rakkomandazzjonijiet tal-bejjiegħ, u jekk ma jkunx hemm kontraindikazzjonijiet, ipprova tbiddel dan il-parametru. Dettalji hawn.

Counters tal-prestazzjoni tas-subsistema tad-disk tal-magni virtwali bażiċi

Il-counters tal-prestazzjoni tas-subsistema tad-disk f'vCenter jinġabru fit-taqsimiet Datastore, Disk, Disk Virtwali:

Analiżi tal-prestazzjoni tal-VM f'VMware vSphere. Parti 3: Ħażna

Fit-taqsima maħżen tad-data hemm metriċi għall-ħażniet tad-disk vSphere (ħwienet tad-dejta) li fuqhom jinsabu d-diski VM. Hawnhekk għandek issib counters standard għal:

  • IOPS (Talbiet medji ta' qari/kitba kull sekonda), 
  • throughput (rata ta' qari/kitba), 
  • dewmien (Aqra/Kitba/L-ogħla latenza).

Fil-prinċipju, kollox huwa ċar mill-ismijiet tal-bankijiet. Ħalli niġbed l-attenzjoni tiegħek għal darb'oħra għall-fatt li l-istatistika hawnhekk mhijiex għal VM speċifiku (jew disk VM), iżda statistika ġenerali għad-datastore kollu. Fl-opinjoni tiegħi, huwa aktar konvenjenti li tħares lejn din l-istatistika f'ESXTOP, għall-inqas ibbażat fuq il-fatt li l-perjodu minimu ta 'kejl hemm 2 sekondi.

Fit-taqsima Disk hemm metriċi fuq apparati blokk li huma użati mill-VM. Hemm counters għal IOPS tat-tip ta' somma (in-numru ta' operazzjonijiet ta' input/output matul il-perjodu ta' kejl) u diversi counters relatati mal-aċċess tal-blokki (Kmandi abortiti, Bus resets). Fl-opinjoni tiegħi, huwa wkoll aktar konvenjenti li tara din l-informazzjoni f'ESXTOP.

Sezzjoni Disk Virtwali – l-aktar utli mil-lat tas-sejba ta' problemi ta' prestazzjoni tas-subsistema tad-disk VM. Hawnhekk tista 'tara l-prestazzjoni għal kull disk virtwali. Hija din l-informazzjoni li hija meħtieġa biex tifhem jekk magna virtwali partikolari għandhiex problema. Minbarra l-counters standard għan-numru ta 'operazzjonijiet I/O, volum ta' qari/kitba u dewmien, din it-taqsima fiha counters utli li juru d-daqs tal-blokk: Daqs tat-talba għall-Aqra/Kitba.

Fl-istampa hawn taħt hemm graff tal-prestazzjoni tad-disk VM, fejn tista 'tara n-numru ta' IOPS, latency u daqs tal-blokk. 

Analiżi tal-prestazzjoni tal-VM f'VMware vSphere. Parti 3: Ħażna

Tista' wkoll tara l-metriċi tal-prestazzjoni għad-datastore kollu jekk is-SIOC hija attivata. Hawnhekk hawn informazzjoni bażika dwar Latency u IOPS medja. B'mod awtomatiku, din l-informazzjoni tista' tara biss f'ħin reali.

Analiżi tal-prestazzjoni tal-VM f'VMware vSphere. Parti 3: Ħażna

ESXTOP

ESXTOP għandu diversi skrins li jipprovdu informazzjoni dwar is-subsistema tad-disk ospitanti kollha kemm hi, magni virtwali individwali u d-diski tagħhom.

Nibdew b'informazzjoni dwar magni virtwali. L-iskrin "Disk VM" tissejjaħ biċ-ċavetta "v":

Analiżi tal-prestazzjoni tal-VM f'VMware vSphere. Parti 3: Ħażna

NVDISK huwa n-numru ta' diski VM. Biex tara l-informazzjoni għal kull disk, agħfas "e" u daħħal il-GID tal-VM ta 'interess.

It-tifsira tal-parametri li jifdal fuq dan l-iskrin hija ċara mill-ismijiet tagħhom.

Skrin utli ieħor meta ssolvi l-problemi huwa Disk adapter. Imsejħa biċ-ċavetta "d" (fields A,B,C,D,E,G jintgħażlu fl-istampa hawn taħt):

Analiżi tal-prestazzjoni tal-VM f'VMware vSphere. Parti 3: Ħażna

NPTH – in-numru ta' mogħdijiet lejn il-qamar li huma viżibbli minn dan l-adapter. Biex tikseb informazzjoni għal kull mogħdija fuq l-adapter, agħfas "e" u daħħal l-isem tal-adapter:

Analiżi tal-prestazzjoni tal-VM f'VMware vSphere. Parti 3: Ħażna

AQLEN – id-daqs massimu tal-kju fuq l-adapter.

Fuq dan l-iskrin hemm ukoll il-counters tad-dewmien li tkellimt dwarhom hawn fuq: KAVG/cmd, GAVG/cmd, DAVG/cmd, QAVG/cmd.

L-iskrin tat-tagħmir tad-Disk, li jissejjaħ billi tagħfas iċ-ċavetta "u", jipprovdi informazzjoni dwar apparati ta 'blokk individwali - moons (oqsma A, B, F, G, I huma magħżula fl-istampa hawn taħt). Hawnhekk tista 'tara l-istatus tal-kju għall-qamar.

Analiżi tal-prestazzjoni tal-VM f'VMware vSphere. Parti 3: Ħażna

DQLEN – id-daqs tal-kju għal apparat blokk.
ACTV – numru ta 'kmandi I/O fil-kernel ESXi.
QUED – numru ta' kmandi I/O fil-kju.
%USD – ACTV / DQLEN × 100%.
TAGĦBIJA – (ACTV + QUED) / DQLEN.

Jekk %USD huwa għoli, għandek tikkunsidra li żżid il-kju. Aktar ma jkun hemm kmandi fil-kju, iktar ikun għoli l-QAVG u, għaldaqstant, il-KAVG.

Tista 'tara wkoll fuq l-iskrin tat-tagħmir tad-Disk jekk VAAI (vStorage API għall-Integrazzjoni ta' Array) huwiex qed jaħdem fuq is-sistema tal-ħażna. Biex tagħmel dan, agħżel l-oqsma A u O.

Il-mekkaniżmu VAAI jippermettilek tittrasferixxi parti mix-xogħol mill-hypervisor direttament għas-sistema tal-ħażna, pereżempju, iż-żero, l-ikkupjar ta 'blokki jew l-imblukkar.

Analiżi tal-prestazzjoni tal-VM f'VMware vSphere. Parti 3: Ħażna

Kif tistgħu taraw fl-istampa ta 'hawn fuq, VAAI jaħdem fuq din is-sistema ta' ħażna: Il-primittivi Zero u ATS jintużaw b'mod attiv.

Suġġerimenti għall-ottimizzazzjoni tax-xogħol mas-subsistema tad-disk fuq ESXi

  • Oqgħod attent għad-daqs tal-blokka.
  • Issettja l-aħjar daqs tal-kju fuq l-HBA.
  • Tinsiex li tattiva SIOC fuq datastores.
  • Agħżel PSP skont ir-rakkomandazzjonijiet tal-manifattur tas-sistema tal-ħażna.
  • Kun żgur li VAAI qed jaħdem.

Artikli utli dwar is-suġġett:http://www.yellow-bricks.com/2011/06/23/disk-schednumreqoutstanding-the-story/
http://www.yellow-bricks.com/2009/09/29/whats-that-alua-exactly/
http://www.yellow-bricks.com/2019/03/05/dqlen-changes-what-is-going-on/
https://www.codyhosterman.com/2017/02/understanding-vmware-esxi-queuing-and-the-flasharray/
https://www.codyhosterman.com/2018/03/what-is-the-latency-stat-qavg/
https://kb.vmware.com/s/article/1267
https://kb.vmware.com/s/article/1268
https://kb.vmware.com/s/article/1027901
https://kb.vmware.com/s/article/2069356
https://kb.vmware.com/s/article/2053628
https://kb.vmware.com/s/article/1003469
https://www.vmware.com/content/dam/digitalmarketing/vmware/en/pdf/techpaper/performance/vsphere-esxi-vcenter-server-67-performance-best-practices.pdf

Sors: www.habr.com

Żid kumment