VMware vSphere-də VM performansının təhlili. 3-cü hissə: Saxlama

VMware vSphere-də VM performansının təhlili. 3-cü hissə: Saxlama

Hissə 1. CPU haqqında
Hissə 2. Yaddaş haqqında

Bu gün biz vSphere-də disk alt sisteminin ölçülərini təhlil edəcəyik. Yaddaş problemi virtual maşının yavaş işləməsinin ən ümumi səbəbidir. Əgər CPU və RAM vəziyyətində problemlərin aradan qaldırılması hipervizor səviyyəsində başa çatırsa, diskdə problemlər varsa, məlumat şəbəkəsi və saxlama sistemi ilə məşğul olmanız lazım ola bilər.

Fayl girişi üçün sayğaclar təxminən eyni olsa da, saxlama sistemlərinə girişin bloklanması nümunəsindən istifadə edərək mövzunu müzakirə edəcəyəm.

Bir az nəzəriyyə

Virtual maşınların disk alt sisteminin performansı haqqında danışarkən insanlar adətən bir-biri ilə əlaqəli üç parametrə diqqət yetirirlər:

  • giriş/çıxış əməliyyatlarının sayı (Saniyədə giriş/çıxış əməliyyatları, IOPS);
  • ötürmə qabiliyyəti;
  • giriş/çıxış əməliyyatlarının gecikməsi (Gecikmə).

IOPS sayı adətən təsadüfi iş yükləri üçün vacibdir: müxtəlif yerlərdə yerləşən disk bloklarına giriş. Belə bir yükə misal olaraq verilənlər bazası, biznes proqramları (ERP, CRM) və s. ola bilər.

Ötürmə qabiliyyəti ardıcıl yüklər üçün vacibdir: bir-birinin ardınca yerləşən bloklara giriş. Məsələn, fayl serverləri (lakin həmişə deyil) və video nəzarət sistemləri belə bir yük yarada bilər.

Ötürmə qabiliyyəti I/O əməliyyatlarının sayı ilə aşağıdakı kimi əlaqələndirilir:

Ötürmə qabiliyyəti = IOPS * Blok ölçüsü, burada Blok ölçüsü blok ölçüsüdür.

Blok ölçüsü kifayət qədər vacib bir xüsusiyyətdir. ESXi-nin müasir versiyaları ölçüsü 32 KB-a qədər olan bloklara imkan verir. Blok daha böyükdürsə, bir neçə yerə bölünür. Bütün saxlama sistemləri belə böyük bloklarla səmərəli işləyə bilmir, ona görə də ESXi Advanced Settings-də DiskMaxIOSize parametri var. Bundan istifadə edərək, hipervizorun atladığı maksimum blok ölçüsünü azalda bilərsiniz (daha ətraflı burada). Bu parametri dəyişdirməzdən əvvəl, saxlama sisteminin istehsalçısı ilə məsləhətləşməyinizi və ya ən azı dəyişiklikləri laboratoriya skamyasında sınamağı məsləhət görürəm. 

Böyük blok ölçüsü saxlama performansına mənfi təsir göstərə bilər. IOPS sayı və ötürmə qabiliyyəti nisbətən kiçik olsa belə, böyük blok ölçüsü ilə yüksək gecikmələr müşahidə edilə bilər. Buna görə də, bu parametrə diqqət yetirin.

gizlilik – ən maraqlı performans parametri. Virtual maşın üçün giriş/çıxış gecikməsi aşağıdakılardan ibarətdir:

  • hipervizor daxilində gecikmələr (KAVG, Average Kernel MilliSec/Read);
  • məlumat şəbəkəsi və saxlama sistemi (DAVG, Average Driver MilliSec/Command) tərəfindən təmin edilən gecikmə.

Qonaq ƏS-də görünən ümumi gecikmə (GAVG, Orta Qonaq MilliSec/Command) KAVG və DAVG-nin cəmidir.

GAVG və DAVG ölçülür və KAVG hesablanır: GAVG–DAVG.

VMware vSphere-də VM performansının təhlili. 3-cü hissə: Saxlama
Mənbə

Gəlin daha yaxından nəzər salaq KAVG. Normal əməliyyat zamanı KAVG sıfıra meyl etməlidir və ya ən azı DAVG-dən çox az olmalıdır. KAVG-nin gözlənilən yüksək olduğu yerdə bildiyim yeganə hal VM diskindəki IOPS limitidir. Bu halda limiti keçməyə çalışdığınız zaman KAVG artacaq.

KAVG-nin ən əhəmiyyətli komponenti QAVG - hipervizor daxilində emal növbəsi vaxtıdır. KAVG-nin qalan komponentləri əhəmiyyətsizdir.

Disk adapter sürücüsündə növbə və ayların növbəsi sabit bir ölçüyə malikdir. Yüksək yüklü mühitlər üçün bu ölçüsü artırmaq faydalı ola bilər. Burada adapter sürücüsündə növbələri necə artıracağını təsvir edir (eyni zamanda ayların növbəsi artacaq). Bu parametr nadir hallarda olan ay ilə yalnız bir VM işlədikdə işləyir. Ayda bir neçə VM varsa, parametri də artırmalısınız Disk.SchedNumReqOlağanüstü (təlimatlar  burada). Növbəni artırmaqla siz müvafiq olaraq QAVG və KAVG-ni azaldırsınız.

Yenə də əvvəlcə HBA satıcısından sənədləri oxuyun və dəyişiklikləri laboratoriya skamyasında sınayın.

Aya növbənin ölçüsünə SIOC (Storage I/O Control) mexanizminin daxil edilməsi təsir göstərə bilər. O, serverlərdəki növbəni aya dinamik şəkildə dəyişdirərək, klasterdəki bütün serverlərdən aya vahid girişi təmin edir. Yəni, hostlardan biri qeyri-mütənasib performans tələb edən VM işlədirsə (səs-küylü qonşu VM), SIOC bu hostda (DQLEN) aya qədər növbə uzunluğunu azaldır. Daha ətraflı burada.

KAVG-ni sıraladıq, indi bir az DAVG. Burada hər şey sadədir: DAVG xarici mühitin (məlumat şəbəkəsi və saxlama sistemi) təqdim etdiyi gecikmədir. Hər müasir və o qədər də müasir olmayan saxlama sisteminin öz performans sayğacları var. DAVG ilə problemləri təhlil etmək üçün onlara baxmaq məntiqlidir. ESXi və saxlama tərəfində hər şey qaydasındadırsa, məlumat şəbəkəsini yoxlayın.

Performans problemlərinin qarşısını almaq üçün yaddaş sisteminiz üçün düzgün Yol Seçimi Siyasətini (PSP) seçin. Demək olar ki, bütün müasir saxlama sistemləri PSP Round-Robin-i dəstəkləyir (ALUA, Asimmetrik Məntiqi Vahid Girişi ilə və ya olmadan). Bu siyasət yaddaş sisteminə bütün mövcud yollardan istifadə etməyə imkan verir. ALUA vəziyyətində, yalnız aya sahib olan nəzarətçiyə gedən yollar istifadə olunur. ESXi-dəki bütün saxlama sistemlərində Round-Robin siyasətini təyin edən standart qaydalar yoxdur. Saxlama sisteminiz üçün heç bir qayda yoxdursa, saxlama sistemi istehsalçısının plaginindən istifadə edin, bu, klasterdəki bütün hostlarda müvafiq qayda yaradacaq və ya özünüz qayda yaradacaq. Təfərrüatlar burada

Həmçinin, bəzi saxlama sistemi istehsalçıları hər yola düşən IOPS sayını standart dəyərdən 1000-dən 1-ə dəyişməyi tövsiyə edirlər. Bizim təcrübəmizdə bu, yaddaş sistemindən daha çox performansı “sıxmağa” və uğursuzluq üçün tələb olunan vaxtı əhəmiyyətli dərəcədə azaltmağa imkan verirdi. nəzarətçinin nasazlığı və ya yeniləməsi halında. Satıcının tövsiyələrini yoxlayın və heç bir əks göstəriş yoxdursa, bu parametri dəyişdirməyə çalışın. Təfərrüatlar burada.

Əsas virtual maşın disk alt sisteminin performans sayğacları

vCenter-də disk alt sisteminin performans sayğacları Datastore, Disk, Virtual Disk bölmələrində toplanır:

VMware vSphere-də VM performansının təhlili. 3-cü hissə: Saxlama

Bölmədə Məlumat anbarı VM disklərinin yerləşdiyi vSphere disk yaddaşları (məlumat anbarları) üçün ölçülər var. Burada standart sayğacları tapa bilərsiniz:

  • IOPS (saniyədə orta oxuma/yazma sorğusu), 
  • ötürmə qabiliyyəti (Oxu/Yazma sürəti), 
  • gecikmələr (Oxu/Yaz/Ən yüksək gecikmə).

Prinsipcə, sayğacların adlarından hər şey aydındır. Bir daha diqqətinizi cəlb edim ki, buradakı statistika konkret VM (və ya VM disk) üçün deyil, bütün məlumat anbarı üçün ümumi statistikadır. Məncə, ESXTOP-da bu statistikaya baxmaq daha rahatdır, ən azından oradakı minimum ölçmə müddətinin 2 saniyə olmasını əsas götürüb.

Bölmədə Disk VM tərəfindən istifadə edilən blok cihazlarında ölçülər var. Toplama tipli IOPS üçün sayğaclar (ölçmə dövrü ərzində giriş/çıxış əməliyyatlarının sayı) və blok girişi ilə əlaqəli bir neçə sayğac (Əmrlər dayandırıldı, Avtobus sıfırlanır). Məncə, bu məlumatı ESXTOP-da görmək də daha rahatdır.

Bölmə Virtual disk – VM disk alt sisteminin performans problemlərini tapmaq baxımından ən faydalıdır. Burada hər bir virtual diskin performansını görə bilərsiniz. Müəyyən bir virtual maşının problemi olub olmadığını anlamaq üçün lazım olan bu məlumatdır. Giriş/çıxış əməliyyatlarının sayı, oxu/yazma həcmi və gecikmələr üçün standart sayğaclara əlavə olaraq, bu bölmədə blok ölçüsünü göstərən faydalı sayğaclar var: Oxu/Yazma sorğusu ölçüsü.

Aşağıdakı şəkildə IOPS sayını, gecikmə müddətini və blok ölçüsünü görə biləcəyiniz VM disk performansının qrafiki var. 

VMware vSphere-də VM performansının təhlili. 3-cü hissə: Saxlama

SIOC aktivdirsə, siz həmçinin bütün məlumat anbarı üçün performans göstəricilərinə baxa bilərsiniz. Budur orta gecikmə və IOPS haqqında əsas məlumatlar. Varsayılan olaraq, bu məlumat yalnız real vaxtda görünə bilər.

VMware vSphere-də VM performansının təhlili. 3-cü hissə: Saxlama

ESXTOP

ESXTOP-da bütövlükdə host disk alt sistemi, fərdi virtual maşınlar və onların diskləri haqqında məlumat verən bir neçə ekran var.

Virtual maşınlar haqqında məlumatla başlayaq. “Disk VM” ekranı “v” düyməsi ilə çağırılır:

VMware vSphere-də VM performansının təhlili. 3-cü hissə: Saxlama

NVDISK VM disklərinin sayıdır. Hər bir disk üçün məlumatı görmək üçün “e” düyməsini basın və maraqlandığınız VM-nin GID-ni daxil edin.

Bu ekranda qalan parametrlərin mənası adlarından aydın olur.

Problemləri həll edərkən digər faydalı ekran Disk adapteridir. “d” düyməsi ilə çağırılır (aşağıdakı şəkildə A,B,C,D,E,G sahələri seçilib):

VMware vSphere-də VM performansının təhlili. 3-cü hissə: Saxlama

NPTH – bu adapterdən görünən aya gedən yolların sayı. Adapterdə hər bir yol üçün məlumat almaq üçün “e” düyməsini basın və adapterin adını daxil edin:

VMware vSphere-də VM performansının təhlili. 3-cü hissə: Saxlama

AQLEN – adapterdə maksimum növbə ölçüsü.

Həmçinin bu ekranda yuxarıda bəhs etdiyim gecikmə sayğacları var: KAVG/cmd, GAVG/cmd, DAVG/cmd, QAVG/cmd.

“u” düyməsini sıxmaqla çağırılan Disk cihazının ekranı fərdi blok cihazları - aylar haqqında məlumat verir (aşağıdakı şəkildə A, B, F, G, I sahələri seçilib). Burada aylar üçün növbənin vəziyyətini görə bilərsiniz.

VMware vSphere-də VM performansının təhlili. 3-cü hissə: Saxlama

DQLEN – blok cihazı üçün növbə ölçüsü.
ACTV – ESXi nüvəsindəki I/O əmrlərinin sayı.
QUED – növbədəki I/O əmrlərinin sayı.
%ABŞ DOLLARI – ACTV / DQLEN × 100%.
YÜK – (ACTV + QUED) / DQLEN.

%USD yüksəkdirsə, növbəni artırmaq barədə düşünməlisiniz. Növbədə nə qədər çox əmr varsa, QAVG və müvafiq olaraq KAVG bir o qədər yüksəkdir.

Siz həmçinin Disk cihazının ekranında VAAI (Array Integration for vStorage API) yaddaş sistemində işlək olub-olmadığını görə bilərsiniz. Bunu etmək üçün A və O sahələrini seçin.

VAAI mexanizmi işin bir hissəsini hipervizordan birbaşa yaddaş sisteminə ötürməyə imkan verir, məsələn, sıfırlama, blokların surətinin çıxarılması və ya bloklanması.

VMware vSphere-də VM performansının təhlili. 3-cü hissə: Saxlama

Yuxarıdakı şəkildə gördüyünüz kimi, VAAI bu saxlama sistemində işləyir: Sıfır və ATS primitivləri aktiv şəkildə istifadə olunur.

ESXi-də disk alt sistemi ilə işi optimallaşdırmaq üçün məsləhətlər

  • Blokun ölçüsünə diqqət yetirin.
  • HBA-da optimal növbə ölçüsünü təyin edin.
  • Məlumat mağazalarında SIOC-u aktivləşdirməyi unutmayın.
  • Saxlama sistemi istehsalçısının tövsiyələrinə uyğun olaraq PSP seçin.
  • VAAI-nin işlədiyinə əmin olun.

Mövzuyla əlaqədar faydalı yazılar:http://www.yellow-bricks.com/2011/06/23/disk-schednumreqoutstanding-the-story/
http://www.yellow-bricks.com/2009/09/29/whats-that-alua-exactly/
http://www.yellow-bricks.com/2019/03/05/dqlen-changes-what-is-going-on/
https://www.codyhosterman.com/2017/02/understanding-vmware-esxi-queuing-and-the-flasharray/
https://www.codyhosterman.com/2018/03/what-is-the-latency-stat-qavg/
https://kb.vmware.com/s/article/1267
https://kb.vmware.com/s/article/1268
https://kb.vmware.com/s/article/1027901
https://kb.vmware.com/s/article/2069356
https://kb.vmware.com/s/article/2053628
https://kb.vmware.com/s/article/1003469
https://www.vmware.com/content/dam/digitalmarketing/vmware/en/pdf/techpaper/performance/vsphere-esxi-vcenter-server-67-performance-best-practices.pdf

Mənbə: www.habr.com

Добавить комментарий