Analisis kinerja VM ing VMware vSphere. Bagean 3: Panyimpenan

Analisis kinerja VM ing VMware vSphere. Bagean 3: Panyimpenan

Part 1. Babagan CPU
Part 2. Babagan Memori

Dina iki kita bakal nganalisa metrik subsistem disk ing vSphere. Masalah panyimpenan minangka alesan sing paling umum kanggo mesin virtual sing alon. Yen, ing kasus CPU lan RAM, ngatasi masalah rampung ing tingkat hypervisor, banjur yen ana masalah karo disk, sampeyan bisa uga kudu ngatasi jaringan data lan sistem panyimpenan.

Aku bakal ngrembug topik nggunakake conto akses pemblokiran kanggo sistem panyimpenan, sanajan kanggo akses file counters kira-kira padha.

Minangka teori

Nalika ngomong babagan kinerja subsistem disk mesin virtual, wong biasane menehi perhatian marang telung paramèter sing saling gegandhengan:

  • jumlah operasi input / output (Operasi Input / Output Per Detik, IOPS);
  • throughput;
  • tundha operasi input / output (Latency).

Jumlah IOPS biasane penting kanggo workloads acak: akses kanggo pamblokiran disk dumunung ing macem-macem panggonan. Conto beban kasebut bisa dadi basis data, aplikasi bisnis (ERP, CRM), lsp.

Bandwidth penting kanggo mbukak urutan: akses kanggo pamblokiran dumunung siji sawise liyane. Contone, server file (nanging ora mesthi) lan sistem pengawasan video bisa ngasilake beban kasebut.

Throughput gegandhengan karo jumlah operasi I/O kaya ing ngisor iki:

Throughput = IOPS * Ukuran blok, ngendi ukuran Blok minangka ukuran blok.

Ukuran blok minangka ciri sing cukup penting. Versi modern saka ESXi ngidini pamblokiran nganti 32 KB ing ukuran. Yen blok luwih gedhe, dipΓ©rang dadi sawetara. Ora kabeh sistem panyimpenan bisa digunakake kanthi efisien karo blok gedhe kasebut, mula ana parameter DiskMaxIOSize ing ESXi Advanced Settings. Nggunakake, sampeyan bisa nyuda ukuran blok maksimal sing dilewati dening hypervisor (rincian liyane kene). Sadurunge ngganti parameter iki, aku nyaranake sampeyan takon karo pabrikan sistem panyimpenan utawa paling ora nyoba owah-owahan ing bangku laboratorium. 

Ukuran blok sing gedhe bisa duweni efek ngrugekake ing kinerja panyimpenan. Sanajan jumlah IOPS lan throughput relatif cilik, latensi dhuwur bisa diamati kanthi ukuran blok sing gedhe. Mulane, mbayar manungsa waΓ© kanggo parameter iki.

Latency - parameter kinerja sing paling menarik. Latensi I/O kanggo mesin virtual kalebu:

  • telat nang hypervisor (KAVG, Rata-rata Kernel MilliSec / Waca);
  • wektu tundha diwenehake dening jaringan transmisi data lan sistem panyimpenan (DAVG, Rata-rata Driver MilliSec / Command).

Total latensi sing katon ing OS tamu (GAVG, Rata-rata Tamu MilliSec / Command) yaiku jumlah KAVG lan DAVG.

GAVG lan DAVG diukur lan KAVG diwilang: GAVG–DAVG.

Analisis kinerja VM ing VMware vSphere. Bagean 3: Panyimpenan
Sumber

Ayo dadi njupuk dipikir nyedhaki KAVG. Sajrone operasi normal, KAVG kudu cenderung nol utawa paling sethithik tinimbang DAVG. Mung cilik aku ngerti ngendi KAVG samesthine dhuwur iku watesan IOPS ing disk VM. Ing kasus iki, nalika sampeyan nyoba ngluwihi watesan, KAVG bakal nambah.

Komponen paling penting saka KAVG yaiku QAVG - wektu antrian pangolahan ing hypervisor. Komponen liyane saka KAVG bisa diabaikan.

Antrian ing driver adaptor disk lan antrian menyang rembulan duwe ukuran tetep. Kanggo lingkungan sing akeh dimuat, bisa uga migunani kanggo nambah ukuran iki. iku nerangake carane nambah antrian ing driver adaptor (ing wektu sing padha antrian kanggo rembulan bakal nambah). Setelan iki bisa digunakake nalika mung siji VM nggarap rembulan, sing arang banget. Yen ana sawetara VM ing rembulan, sampeyan uga kudu nambah parameter kasebut Disk.SchedNumReqOutstanding (instruksi  kene). Kanthi nambah antrian, sampeyan nyuda QAVG lan KAVG.

Nanging maneh, pisanan maca dokumentasi saka vendor HBA lan nyoba owah-owahan ing bangku lab.

Ukuran antrian menyang rembulan bisa kena pengaruh saka mekanisme SIOC (Storage I / O Control). Nyedhiyakake akses seragam menyang rembulan saka kabeh server ing kluster kanthi ngganti antrian kanthi dinamis menyang rembulan ing server. Sing, yen salah siji saka sarwa dumadi mlaku VM sing mbutuhake jumlah disproportionate kinerja (noise tetanggan VM), nyuda SIOC dawa antrian kanggo rembulan ing host iki (DQLEN). rincian liyane kene.

Kita wis diurutake metu KAVG, saiki sethitik babagan DAVG. Kabeh iku prasaja ing kene: DAVG minangka wektu tundha sing diwenehake dening lingkungan eksternal (jaringan data lan sistem panyimpenan). Saben sistem panyimpenan modern lan ora modern duwe counter kinerja dhewe. Kanggo njelasno masalah karo DAVG, iku ndadekake pangertèn kanggo ndeleng ing. Yen kabeh iku nggoleki ing sisih ESXi lan panyimpenan, mriksa jaringan data.

Kanggo ngindhari masalah kinerja, pilih Path Selection Policy (PSP) sing bener kanggo sistem panyimpenan. Meh kabeh sistem panyimpenan modern ndhukung PSP Round-Robin (nganggo utawa tanpa ALUA, Asymmetric Logical Unit Access). Kabijakan iki ngidini sampeyan nggunakake kabeh jalur sing kasedhiya menyang sistem panyimpenan. Ing kasus ALUA, mung dalan menyang pengontrol sing duwe rembulan sing digunakake. Ora kabeh sistem panyimpenan ing ESXi duwe aturan standar sing nyetel kabijakan Round-Robin. Yen ora ana aturan kanggo sistem panyimpenan, gunakake plugin saka pabrikan sistem panyimpenan, sing bakal nggawe aturan sing cocog kanggo kabeh host ing kluster, utawa nggawe aturan dhewe. Rincian kene

Uga, sawetara pabrikan sistem panyimpenan nyaranake ngganti nomer IOPS saben jalur saka nilai standar 1000 dadi 1. Ing praktik kita, iki ndadekake bisa "remet" kinerja luwih saka sistem panyimpenan lan nyuda wektu sing dibutuhake kanggo failover. ing acara saka Gagal controller utawa nganyari. Priksa rekomendasi vendor, lan yen ora ana contraindications, coba ganti parameter iki. Rincian kene.

Counter kinerja subsistem disk mesin virtual dhasar

Penghitung kinerja subsistem disk ing vCenter diklumpukake ing bagean Datastore, Disk, Disk Virtual:

Analisis kinerja VM ing VMware vSphere. Bagean 3: Panyimpenan

bagean nyimpen data ana metrik kanggo panyimpenan disk vSphere (datastores) ing ngendi disk VM dumunung. Ing kene sampeyan bakal nemokake counter standar kanggo:

  • IOPS (Panjaluk maca / nulis rata-rata per detik), 
  • throughput (Read/Write rate), 
  • wektu tundha (Waca / Tulis / Latensi paling dhuwur).

Ing asas, kabeh wis cetha saka jeneng counters. Ayo kula tarik manungsa waΓ© maneh kanggo kasunyatan sing statistik kene ora kanggo VM tartamtu (utawa VM disk), nanging statistik umum kanggo kabeh datastore. Ing mratelakake panemume, iku luwih trep kanggo ndeleng statistik iki ing ESXTOP, paling adhedhasar kasunyatan sing wektu pangukuran minimal ana 2 detik.

bagean disk ana metrik ing piranti pamblokiran sing digunakake dening VM. Ana counters kanggo IOPS saka jinis summation (jumlah input / operasi output sak periode pangukuran) lan sawetara counters related kanggo akses pemblokiran (Commanded aborted, Bus reset). Ing mratelakake panemume, iku uga luwih trep kanggo ndeleng informasi iki ing ESXTOP.

Bagean Disk Virtual - sing paling migunani saka sudut pandang nemokake masalah kinerja subsistem disk VM. Ing kene sampeyan bisa ndeleng kinerja kanggo saben disk virtual. Iki informasi sing dibutuhake kanggo ngerti apa mesin virtual tartamtu duwe masalah. Saliyane ing counters standar kanggo nomer I / O operasi, maca / nulis volume lan telat, bagean iki ngandhut counter migunani sing nuduhake ukuran pemblokiran: Maca / Nulis ukuran request.

Ing gambar ing ngisor iki ana grafik kinerja disk VM, ing ngendi sampeyan bisa ndeleng nomer IOPS, latensi lan ukuran blok. 

Analisis kinerja VM ing VMware vSphere. Bagean 3: Panyimpenan

Sampeyan uga bisa ndeleng metrik kinerja kanggo kabeh datastore yen SIOC diaktifake. Iki minangka informasi dhasar babagan Latency lan IOPS rata-rata. Kanthi gawan, informasi iki mung bisa dideleng ing wektu nyata.

Analisis kinerja VM ing VMware vSphere. Bagean 3: Panyimpenan

ESXTOP

ESXTOP wis sawetara layar sing nyedhiyani informasi ing subsistem disk inang minangka kabèh, mesin virtual individu lan disk sing.

Ayo dadi miwiti karo informasi ing mesin virtual. Layar "Disk VM" diarani nganggo tombol "v":

Analisis kinerja VM ing VMware vSphere. Bagean 3: Panyimpenan

NVDISK yaiku jumlah disk VM. Kanggo ndeleng informasi kanggo saben disk, pencet "e" lan ketik GID saka VM kapentingan.

Makna paramèter sing isih ana ing layar iki jelas saka jenenge.

Layar liyane sing migunani nalika ngatasi masalah yaiku adaptor Disk. Disebut kanthi tombol "d" (bidang A, B, C, D, E, G dipilih ing gambar ing ngisor iki):

Analisis kinerja VM ing VMware vSphere. Bagean 3: Panyimpenan

NPTH – jumlah dalan menyang rembulan sing katon saka adaptor iki. Kanggo entuk informasi kanggo saben dalan ing adaptor, penet "e" banjur ketik jeneng adaptor:

Analisis kinerja VM ing VMware vSphere. Bagean 3: Panyimpenan

AQLEN – ukuran antrian maksimum ing adaptor.

Uga ing layar iki ana counter tundha sing dakkandhakake ing ndhuwur: KAVG/cmd, GAVG/cmd, DAVG/cmd, QAVG/cmd.

Layar piranti Disk, sing diarani kanthi mencet tombol "u", nyedhiyakake informasi babagan piranti blok individu - bulan (kotak A, B, F, G, I dipilih ing gambar ing ngisor iki). Ing kene sampeyan bisa ndeleng status antrian kanggo rembulan.

Analisis kinerja VM ing VMware vSphere. Bagean 3: Panyimpenan

DQLEN – ukuran antrian kanggo piranti pamblokiran.
ACTV – nomer I / O printah ing kernel ESXi.
QUED – nomer I / O printah ing antrian.
%USD – ACTV / DQLEN Γ— 100%.
MAUTAN – (ACTV + QUED) / DQLEN.

Yen %USD dhuwur, sampeyan kudu nimbang nambah antrian. Sing liyane printah ing antrian, sing luwih dhuwur QAVG lan, miturut, ing KAVG.

Sampeyan uga bisa ndeleng ing layar piranti Disk apa VAAI (vStorage API kanggo Integrasi Array) mlaku ing sistem panyimpenan. Kanggo nindakake iki, pilih kolom A lan O.

Mekanisme VAAI ngidini sampeyan nransfer bagean saka karya saka hypervisor langsung menyang sistem panyimpenan, contone, zeroing, nyalin blok utawa mblokir.

Analisis kinerja VM ing VMware vSphere. Bagean 3: Panyimpenan

Minangka sampeyan bisa ndeleng ing gambar ndhuwur, VAAI dianggo ing sistem panyimpenan iki: Zero lan ATS primitif aktif digunakake.

Tips kanggo ngoptimalake karya karo subsistem disk ing ESXi

  • Pay manungsa waΓ© menyang ukuran blok.
  • Setel ukuran antrian optimal ing HBA.
  • Aja lali ngaktifake SIOC ing datastores.
  • Pilih PSP sesuai karo rekomendasi pabrikan sistem panyimpenan.
  • Priksa manawa VAAI bisa digunakake.

Artikel sing migunani:http://www.yellow-bricks.com/2011/06/23/disk-schednumreqoutstanding-the-story/
http://www.yellow-bricks.com/2009/09/29/whats-that-alua-exactly/
http://www.yellow-bricks.com/2019/03/05/dqlen-changes-what-is-going-on/
https://www.codyhosterman.com/2017/02/understanding-vmware-esxi-queuing-and-the-flasharray/
https://www.codyhosterman.com/2018/03/what-is-the-latency-stat-qavg/
https://kb.vmware.com/s/article/1267
https://kb.vmware.com/s/article/1268
https://kb.vmware.com/s/article/1027901
https://kb.vmware.com/s/article/2069356
https://kb.vmware.com/s/article/2053628
https://kb.vmware.com/s/article/1003469
https://www.vmware.com/content/dam/digitalmarketing/vmware/en/pdf/techpaper/performance/vsphere-esxi-vcenter-server-67-performance-best-practices.pdf

Source: www.habr.com

Add a comment