VMware vSphere मध्ये VM कामगिरीचे विश्लेषण. भाग 3: स्टोरेज

VMware vSphere मध्ये VM कामगिरीचे विश्लेषण. भाग 3: स्टोरेज

भाग 1. CPU बद्दल
भाग 2. मेमरी बद्दल

आज आपण vSphere मधील डिस्क सबसिस्टमच्या मेट्रिक्सचे विश्लेषण करू. स्लो वर्च्युअल मशीनसाठी स्टोरेज समस्या हे सर्वात सामान्य कारण आहे. जर, CPU आणि RAM च्या बाबतीत, हायपरवाइजर स्तरावर समस्यानिवारण समाप्त होते, तर डिस्कमध्ये समस्या असल्यास, आपल्याला डेटा नेटवर्क आणि स्टोरेज सिस्टमला सामोरे जावे लागेल.

मी स्टोरेज सिस्टममध्ये ब्लॉक ऍक्सेसचे उदाहरण वापरून या विषयावर चर्चा करेन, जरी फाइल ऍक्सेससाठी काउंटर अंदाजे समान आहेत.

सिद्धांताचा बिट

व्हर्च्युअल मशीनच्या डिस्क सबसिस्टमच्या कामगिरीबद्दल बोलत असताना, लोक सहसा तीन परस्परसंबंधित पॅरामीटर्सकडे लक्ष देतात:

  • इनपुट/आउटपुट ऑपरेशन्सची संख्या (प्रति सेकंद इनपुट/आउटपुट ऑपरेशन्स, IOPS);
  • थ्रुपुट;
  • इनपुट/आउटपुट ऑपरेशन्सचा विलंब (विलंब).

IOPS ची संख्या सामान्यतः यादृच्छिक वर्कलोड्ससाठी महत्त्वाचे: वेगवेगळ्या ठिकाणी असलेल्या डिस्क ब्लॉक्समध्ये प्रवेश. अशा लोडचे उदाहरण डेटाबेस, व्यवसाय अनुप्रयोग (ERP, CRM) इत्यादी असू शकते.

बँडविड्थ अनुक्रमिक भारांसाठी महत्त्वाचे: एकामागून एक असलेल्या ब्लॉक्समध्ये प्रवेश. उदाहरणार्थ, फाइल सर्व्हर (परंतु नेहमीच नाही) आणि व्हिडिओ पाळत ठेवणे प्रणाली अशा लोड व्युत्पन्न करू शकतात.

थ्रूपुट खालीलप्रमाणे I/O ऑपरेशन्सच्या संख्येशी संबंधित आहे:

थ्रूपुट = IOPS * ब्लॉक आकार, जेथे ब्लॉक आकार ब्लॉक आकार आहे.

ब्लॉक आकार हे एक अतिशय महत्वाचे वैशिष्ट्य आहे. ESXi च्या आधुनिक आवृत्त्या 32 KB आकाराच्या ब्लॉकला परवानगी देतात. जर ब्लॉक आणखी मोठा असेल तर तो अनेकांमध्ये विभागला जाईल. सर्व स्टोरेज सिस्टम अशा मोठ्या ब्लॉक्ससह कार्यक्षमतेने कार्य करू शकत नाहीत, म्हणून ESXi प्रगत सेटिंग्जमध्ये DiskMaxIOSize पॅरामीटर आहे. त्याचा वापर करून, तुम्ही हायपरवाइजरने वगळलेले जास्तीत जास्त ब्लॉक आकार कमी करू शकता (अधिक तपशील येथे). हे पॅरामीटर बदलण्यापूर्वी, मी शिफारस करतो की आपण स्टोरेज सिस्टम निर्मात्याशी सल्लामसलत करा किंवा कमीतकमी प्रयोगशाळेच्या बेंचवर बदल तपासा. 

मोठ्या ब्लॉक आकाराचा स्टोरेज कार्यक्षमतेवर हानिकारक प्रभाव पडू शकतो. जरी IOPS आणि थ्रूपुटची संख्या तुलनेने लहान असली तरीही, मोठ्या ब्लॉक आकारासह उच्च विलंब लक्षात घेता येतो. म्हणून, या पॅरामीटरकडे लक्ष द्या.

लेटेंसी - सर्वात मनोरंजक कामगिरी पॅरामीटर. व्हर्च्युअल मशीनसाठी I/O लेटन्सीमध्ये हे समाविष्ट आहे:

  • हायपरवाइजरच्या आत विलंब (KAVG, सरासरी कर्नल मिलीसेक/रीड);
  • डेटा नेटवर्क आणि स्टोरेज सिस्टमद्वारे प्रदान केलेला विलंब (DAVG, सरासरी ड्रायव्हर MilliSec/Command).

अतिथी OS (GAVG, सरासरी अतिथी MilliSec/Command) मध्ये दिसणारी एकूण विलंबता ही KAVG आणि DAVG ची बेरीज आहे.

GAVG आणि DAVG मोजले जातात आणि KAVG ची गणना केली जाते: GAVG-DAVG.

VMware vSphere मध्ये VM कामगिरीचे विश्लेषण. भाग 3: स्टोरेज
स्त्रोत

चला जवळून बघूया KAVG. सामान्य ऑपरेशन दरम्यान, KAVG शून्याकडे झुकते किंवा किमान DAVG पेक्षा खूपच कमी असावे. VM डिस्कवरील IOPS मर्यादा म्हणजे KAVG अपेक्षेने जास्त कुठे आहे हे मला माहीत आहे. या प्रकरणात, जेव्हा तुम्ही मर्यादा ओलांडण्याचा प्रयत्न कराल, तेव्हा KAVG वाढेल.

KAVG चा सर्वात महत्वाचा घटक QAVG आहे - हायपरवाइजरच्या आत प्रोसेसिंग क्यू वेळ. KAVG चे उर्वरित घटक नगण्य आहेत.

डिस्क ॲडॉप्टर ड्रायव्हरमधील रांग आणि चंद्राच्या रांगेचा आकार निश्चित आहे. अत्यंत लोड केलेल्या वातावरणासाठी, हा आकार वाढवणे उपयुक्त ठरू शकते. तो आहे ॲडॉप्टर ड्रायव्हरमध्ये रांग कशी वाढवायची याचे वर्णन करते (त्याच वेळी चंद्राची रांग वाढेल). ही सेटिंग चंद्रासोबत फक्त एक VM कार्य करत असताना कार्य करते, जे दुर्मिळ आहे. चंद्रावर अनेक व्हीएम असल्यास, आपण पॅरामीटर देखील वाढवणे आवश्यक आहे Disk.SchedNumReqOutstanding (सूचना  येथे). रांग वाढवून, तुम्ही अनुक्रमे QAVG आणि KAVG कमी करता.

परंतु पुन्हा, प्रथम एचबीए विक्रेत्याकडून कागदपत्रे वाचा आणि प्रयोगशाळेच्या खंडपीठावर बदलांची चाचणी घ्या.

चंद्राच्या रांगेचा आकार SIOC (स्टोरेज I/O कंट्रोल) यंत्रणेच्या समावेशामुळे प्रभावित होऊ शकतो. हे क्लस्टरमधील सर्व सर्व्हरवरून चंद्रावर एकसमान प्रवेश प्रदान करते आणि सर्व्हरवरील चंद्रावर रांग गतिमानपणे बदलून. म्हणजेच, जर यजमानांपैकी एक VM चालवत असेल ज्यासाठी असमान प्रमाणात कार्यप्रदर्शन आवश्यक आहे (गोंगाट करणारा शेजारी VM), SIOC या होस्ट (DQLEN) वर चंद्रापर्यंत रांगेची लांबी कमी करते. अधिक माहितीसाठी येथे.

आम्ही KAVG ची क्रमवारी लावली आहे, आता याबद्दल थोडेसे DAVG. येथे सर्व काही सोपे आहे: DAVG बाह्य वातावरण (डेटा नेटवर्क आणि स्टोरेज सिस्टम) द्वारे सादर केलेला विलंब आहे. प्रत्येक आधुनिक आणि इतके आधुनिक स्टोरेज सिस्टमचे स्वतःचे कार्यप्रदर्शन काउंटर आहेत. DAVG मधील समस्यांचे विश्लेषण करण्यासाठी, त्यांच्याकडे पाहणे अर्थपूर्ण आहे. ESXi आणि स्टोरेज बाजूला सर्वकाही ठीक असल्यास, डेटा नेटवर्क तपासा.

कार्यप्रदर्शन समस्या टाळण्यासाठी, तुमच्या स्टोरेज सिस्टमसाठी योग्य पथ निवड धोरण (PSP) निवडा. जवळजवळ सर्व आधुनिक स्टोरेज सिस्टम PSP राऊंड-रॉबिन (ALUA, असममित लॉजिकल युनिट ऍक्सेससह किंवा त्याशिवाय) सपोर्ट करतात. हे धोरण तुम्हाला स्टोरेज सिस्टमचे सर्व उपलब्ध मार्ग वापरण्याची परवानगी देते. ALUA च्या बाबतीत, केवळ चंद्राचा मालक असलेल्या नियंत्रकाकडे जाणारे मार्ग वापरले जातात. ESXi वरील सर्व स्टोरेज सिस्टममध्ये राऊंड-रॉबिन धोरण सेट करणारे डीफॉल्ट नियम नाहीत. तुमच्या स्टोरेज सिस्टमसाठी कोणतेही नियम नसल्यास, स्टोरेज सिस्टम निर्मात्याकडून प्लगइन वापरा, जे क्लस्टरमधील सर्व होस्टवर संबंधित नियम तयार करेल किंवा स्वतः नियम तयार करेल. तपशील येथे

तसेच, काही स्टोरेज सिस्टीम उत्पादक प्रति पथ IOPS ची संख्या 1000 च्या मानक मूल्यावरून 1 वर बदलण्याची शिफारस करतात. आमच्या व्यवहारात, यामुळे स्टोरेज सिस्टममधून अधिक कार्यप्रदर्शन "पिळून" करणे शक्य झाले आणि फेलओव्हरसाठी लागणारा वेळ लक्षणीयरीत्या कमी केला. कंट्रोलर अयशस्वी झाल्यास किंवा अपडेट झाल्यास. विक्रेत्याच्या शिफारशी तपासा आणि कोणतेही contraindication नसल्यास, हे पॅरामीटर बदलण्याचा प्रयत्न करा. तपशील येथे.

बेसिक व्हर्च्युअल मशीन डिस्क सबसिस्टम परफॉर्मन्स काउंटर

vCenter मधील डिस्क सबसिस्टम परफॉर्मन्स काउंटर डेटास्टोर, डिस्क, व्हर्च्युअल डिस्क विभागांमध्ये गोळा केले जातात:

VMware vSphere मध्ये VM कामगिरीचे विश्लेषण. भाग 3: स्टोरेज

विभाग डेटास्टोर vSphere डिस्क स्टोरेज (डेटास्टोअर) साठी मेट्रिक्स आहेत ज्यावर VM डिस्क स्थित आहेत. येथे तुम्हाला यासाठी मानक काउंटर सापडतील:

  • IOPS (सरासरी वाचन/लिहा विनंत्या प्रति सेकंद), 
  • थ्रुपुट (वाचा/लिहा दर), 
  • विलंब (वाचा/लिहा/उच्चतम विलंब).

तत्वतः, काउंटरच्या नावावरून सर्व काही स्पष्ट आहे. मी तुमचे लक्ष पुन्हा एकदा या वस्तुस्थितीकडे वेधून घेतो की येथील आकडेवारी विशिष्ट VM (किंवा VM डिस्क) साठी नसून संपूर्ण डेटास्टोअरसाठी सामान्य आकडेवारी आहे. माझ्या मते, किमान मोजमाप कालावधी 2 सेकंद आहे या वस्तुस्थितीवर आधारित ESXTOP मध्ये ही आकडेवारी पाहणे अधिक सोयीचे आहे.

विभाग डिस्क VM द्वारे वापरल्या जाणाऱ्या ब्लॉक उपकरणांवर मेट्रिक्स आहेत. समेशन प्रकाराच्या IOPS साठी काउंटर आहेत (मापन कालावधी दरम्यान इनपुट/आउटपुट ऑपरेशन्सची संख्या) आणि ब्लॉक ऍक्सेसशी संबंधित अनेक काउंटर (कमांड रद्द केले, बस रीसेट). माझ्या मते, ही माहिती ESXTOP मध्ये पाहणे देखील अधिक सोयीचे आहे.

विभाग व्हर्च्युअल डिस्क - व्हीएम डिस्क सबसिस्टमच्या कार्यप्रदर्शन समस्या शोधण्याच्या दृष्टिकोनातून सर्वात उपयुक्त. येथे तुम्ही प्रत्येक आभासी डिस्कचे कार्यप्रदर्शन पाहू शकता. विशिष्ट व्हर्च्युअल मशीनमध्ये समस्या आहे की नाही हे समजून घेण्यासाठी ही माहिती आवश्यक आहे. I/O ऑपरेशन्स, रीड/राइट व्हॉल्यूम आणि विलंब यासाठी मानक काउंटर व्यतिरिक्त, या विभागात उपयुक्त काउंटर आहेत जे ब्लॉक आकार दर्शवतात: रिक्वेस्ट रिक्वेस्ट साइज.

खालील चित्रात VM डिस्क कार्यप्रदर्शनाचा आलेख आहे, जिथे तुम्ही IOPS ची संख्या, लेटन्सी आणि ब्लॉक आकार पाहू शकता. 

VMware vSphere मध्ये VM कामगिरीचे विश्लेषण. भाग 3: स्टोरेज

SIOC सक्षम केले असल्यास तुम्ही संपूर्ण डेटास्टोअरचे कार्यप्रदर्शन मेट्रिक्स देखील पाहू शकता. सरासरी लेटन्सी आणि IOPS वर मूलभूत माहिती येथे आहे. डीफॉल्टनुसार, ही माहिती केवळ रिअल टाइममध्ये पाहिली जाऊ शकते.

VMware vSphere मध्ये VM कामगिरीचे विश्लेषण. भाग 3: स्टोरेज

ESXTOP

ESXTOP मध्ये अनेक स्क्रीन्स आहेत ज्या संपूर्णपणे होस्ट डिस्क सबसिस्टम, वैयक्तिक व्हर्च्युअल मशीन आणि त्यांच्या डिस्क्सची माहिती देतात.

चला व्हर्च्युअल मशीनवरील माहितीसह प्रारंभ करूया. "डिस्क VM" स्क्रीनला "v" की सह कॉल केले जाते:

VMware vSphere मध्ये VM कामगिरीचे विश्लेषण. भाग 3: स्टोरेज

NVDISK VM डिस्कची संख्या आहे. प्रत्येक डिस्कसाठी माहिती पाहण्यासाठी, "e" दाबा आणि स्वारस्य असलेल्या VM चा GID प्रविष्ट करा.

या स्क्रीनवरील उर्वरित पॅरामीटर्सचा अर्थ त्यांच्या नावांवरून स्पष्ट होतो.

समस्यानिवारण करताना दुसरी उपयुक्त स्क्रीन म्हणजे डिस्क अडॅप्टर. "d" की ने कॉल केला (खालील चित्रात A, B, C, D, E, G फील्ड निवडले आहेत):

VMware vSphere मध्ये VM कामगिरीचे विश्लेषण. भाग 3: स्टोरेज

NPTH – या अडॅप्टरमधून दिसणाऱ्या चंद्रावर जाणाऱ्या मार्गांची संख्या. अडॅप्टरवरील प्रत्येक पथाची माहिती मिळवण्यासाठी, “e” दाबा आणि अडॅप्टरचे नाव प्रविष्ट करा:

VMware vSphere मध्ये VM कामगिरीचे विश्लेषण. भाग 3: स्टोरेज

AQLEN - ॲडॉप्टरवरील कमाल रांगेचा आकार.

तसेच या स्क्रीनवर विलंब काउंटर आहेत ज्याबद्दल मी वर बोललो: KAVG/cmd, GAVG/cmd, DAVG/cmd, QAVG/cmd.

डिस्क डिव्हाइस स्क्रीन, जी "u" की दाबून कॉल केली जाते, वैयक्तिक ब्लॉक डिव्हाइसेसची माहिती प्रदान करते - चंद्र (फील्ड A, B, F, G, I खालील चित्रात निवडले आहेत). येथे आपण चंद्रांसाठी रांगेची स्थिती पाहू शकता.

VMware vSphere मध्ये VM कामगिरीचे विश्लेषण. भाग 3: स्टोरेज

DQLEN - ब्लॉक डिव्हाइससाठी रांगेचा आकार.
ACTV - ESXi कर्नलमधील I/O आदेशांची संख्या.
QUED - रांगेतील I/O आदेशांची संख्या.
%अमेरिकन डॉलर - ACTV / DQLEN × 100%.
लोड - (ACTV + QUED) / DQLEN.

जर % USD जास्त असेल, तर तुम्ही रांग वाढवण्याचा विचार केला पाहिजे. रांगेत जितके अधिक आदेश असतील तितके QAVG आणि त्यानुसार, KAVG.

VAAI (ॲरे इंटिग्रेशनसाठी vStorage API) स्टोरेज सिस्टमवर चालत आहे की नाही हे तुम्ही डिस्क डिव्हाइस स्क्रीनवर देखील पाहू शकता. हे करण्यासाठी, A आणि O फील्ड निवडा.

VAAI यंत्रणा तुम्हाला कामाचा काही भाग हायपरवाइजरमधून थेट स्टोरेज सिस्टममध्ये हस्तांतरित करण्याची परवानगी देते, उदाहरणार्थ, शून्य करणे, ब्लॉक कॉपी करणे किंवा ब्लॉक करणे.

VMware vSphere मध्ये VM कामगिरीचे विश्लेषण. भाग 3: स्टोरेज

जसे आपण वरील चित्रात पाहू शकता, VAAI या स्टोरेज सिस्टमवर कार्य करते: शून्य आणि एटीएस आदिम सक्रियपणे वापरले जातात.

ESXi वर डिस्क सबसिस्टमसह कार्य ऑप्टिमाइझ करण्यासाठी टिपा

  • ब्लॉक आकाराकडे लक्ष द्या.
  • HBA वर इष्टतम रांगेचा आकार सेट करा.
  • डेटास्टोअरवर SIOC सक्षम करण्यास विसरू नका.
  • स्टोरेज सिस्टम निर्मात्याच्या शिफारशींनुसार PSP निवडा.
  • VAAI काम करत असल्याची खात्री करा.

विषयावरील उपयुक्त लेख:http://www.yellow-bricks.com/2011/06/23/disk-schednumreqoutstanding-the-story/
http://www.yellow-bricks.com/2009/09/29/whats-that-alua-exactly/
http://www.yellow-bricks.com/2019/03/05/dqlen-changes-what-is-going-on/
https://www.codyhosterman.com/2017/02/understanding-vmware-esxi-queuing-and-the-flasharray/
https://www.codyhosterman.com/2018/03/what-is-the-latency-stat-qavg/
https://kb.vmware.com/s/article/1267
https://kb.vmware.com/s/article/1268
https://kb.vmware.com/s/article/1027901
https://kb.vmware.com/s/article/2069356
https://kb.vmware.com/s/article/2053628
https://kb.vmware.com/s/article/1003469
https://www.vmware.com/content/dam/digitalmarketing/vmware/en/pdf/techpaper/performance/vsphere-esxi-vcenter-server-67-performance-best-practices.pdf

स्त्रोत: www.habr.com

एक टिप्पणी जोडा