VMware vSphere میں VM کارکردگی کا تجزیہ۔ حصہ 3: ذخیرہ

VMware vSphere میں VM کارکردگی کا تجزیہ۔ حصہ 3: ذخیرہ

حصہ 1۔ سی پی یو کے بارے میں
حصہ 2۔ میموری کے بارے میں

آج ہم vSphere میں ڈسک سب سسٹم کے میٹرکس کا تجزیہ کریں گے۔ سٹوریج کا مسئلہ سست ورچوئل مشین کی سب سے عام وجہ ہے۔ اگر، CPU اور RAM کے معاملے میں، ٹربل شوٹنگ ہائپر وائزر کی سطح پر ختم ہو جاتی ہے، پھر اگر ڈسک کے ساتھ مسائل ہیں، تو آپ کو ڈیٹا نیٹ ورک اور اسٹوریج سسٹم سے نمٹنا پڑ سکتا ہے۔

میں سٹوریج سسٹم تک بلاک رسائی کی مثال کا استعمال کرتے ہوئے اس موضوع پر بات کروں گا، حالانکہ فائل تک رسائی کے لیے کاؤنٹرز تقریباً ایک جیسے ہیں۔

تھوڑا سا اصول

ورچوئل مشینوں کے ڈسک سب سسٹم کی کارکردگی کے بارے میں بات کرتے وقت، لوگ عام طور پر تین باہم منسلک پیرامیٹرز پر توجہ دیتے ہیں:

  • ان پٹ/آؤٹ پٹ آپریشنز کی تعداد (ان پٹ/آؤٹ پٹ آپریشن فی سیکنڈ، IOPS)؛
  • تھرو پٹ
  • ان پٹ/آؤٹ پٹ آپریشنز میں تاخیر (لیٹنسی)۔

IOPS کی تعداد عام طور پر بے ترتیب کام کے بوجھ کے لیے اہم: مختلف جگہوں پر واقع ڈسک بلاکس تک رسائی۔ اس طرح کے بوجھ کی ایک مثال ڈیٹا بیس، کاروباری ایپلی کیشنز (ERP، CRM) وغیرہ ہو سکتی ہے۔

بینڈوڈتھ ترتیب وار بوجھ کے لیے اہم: ایک کے بعد ایک واقع بلاکس تک رسائی۔ مثال کے طور پر، فائل سرورز (لیکن ہمیشہ نہیں) اور ویڈیو سرویلنس سسٹم اس طرح کا بوجھ پیدا کر سکتے ہیں۔

تھرو پٹ مندرجہ ذیل I/O آپریشنز کی تعداد سے متعلق ہے:

تھرو پٹ = IOPS * بلاک سائز، جہاں بلاک کا سائز بلاک کا سائز ہے۔

بلاک کا سائز کافی اہم خصوصیت ہے۔ ESXi کے جدید ورژن 32 KB سائز کے بلاکس کی اجازت دیتے ہیں۔ اگر بلاک اس سے بھی بڑا ہے تو اسے کئی حصوں میں تقسیم کیا جاتا ہے۔ تمام سٹوریج سسٹم اتنے بڑے بلاکس کے ساتھ مؤثر طریقے سے کام نہیں کر سکتے، اس لیے ESXi ایڈوانس سیٹنگز میں DiskMaxIOSize پیرامیٹر موجود ہے۔ اس کا استعمال کرتے ہوئے، آپ ہائپر وائزر کے ذریعے چھوڑے گئے زیادہ سے زیادہ بلاک سائز کو کم کر سکتے ہیں (مزید تفصیلات یہاں)۔ اس پیرامیٹر کو تبدیل کرنے سے پہلے، میں تجویز کرتا ہوں کہ آپ سٹوریج سسٹم بنانے والے سے مشورہ کریں یا کم از کم لیبارٹری بینچ پر تبدیلیوں کی جانچ کریں۔ 

ایک بڑا بلاک سائز اسٹوریج کی کارکردگی پر نقصان دہ اثر ڈال سکتا ہے۔ یہاں تک کہ اگر IOPS اور تھرو پٹ کی تعداد نسبتاً کم ہے، تو بڑے بلاک سائز کے ساتھ زیادہ تاخیر کا مشاہدہ کیا جا سکتا ہے۔ لہذا، اس پیرامیٹر پر توجہ دینا.

تاخیر - سب سے دلچسپ کارکردگی کا پیرامیٹر۔ ورچوئل مشین کے لیے I/O لیٹنسی پر مشتمل ہے:

  • ہائپر وائزر کے اندر تاخیر (KAVG، اوسط کرنل ملی سیک/پڑھیں)؛
  • ڈیٹا نیٹ ورک اور اسٹوریج سسٹم (DAVG، اوسط ڈرائیور MilliSec/Command) کے ذریعے فراہم کردہ تاخیر۔

مہمان OS (GAVG، اوسط گیسٹ ملی سیک/کمانڈ) میں نظر آنے والی کل تاخیر KAVG اور DAVG کا مجموعہ ہے۔

GAVG اور DAVG کی پیمائش کی جاتی ہے اور KAVG کا حساب لگایا جاتا ہے: GAVG–DAVG۔

VMware vSphere میں VM کارکردگی کا تجزیہ۔ حصہ 3: ذخیرہ
ماخذ

آئیے قریب سے دیکھیں KAVG. عام آپریشن کے دوران، KAVG کا رجحان DAVG سے صفر یا کم از کم بہت کم ہونا چاہیے۔ میں صرف ایک ہی معاملہ جانتا ہوں جہاں KAVG متوقع طور پر زیادہ ہے VM ڈسک پر IOPS کی حد ہے۔ اس صورت میں، جب آپ حد سے تجاوز کرنے کی کوشش کریں گے، تو KAVG بڑھ جائے گا۔

KAVG کا سب سے اہم جزو QAVG ہے - ہائپر وائزر کے اندر پروسیسنگ قطار کا وقت۔ KAVG کے باقی اجزاء نہ ہونے کے برابر ہیں۔

ڈسک اڈاپٹر ڈرائیور میں قطار اور چاندوں کی قطار کا سائز ایک مقررہ ہے۔ بہت زیادہ بھرے ہوئے ماحول کے لیے، اس سائز کو بڑھانا مفید ہو سکتا ہے۔ یہاں بیان کرتا ہے کہ اڈاپٹر ڈرائیور میں قطاروں کو کیسے بڑھایا جائے (ایک ہی وقت میں چاندوں کی قطار بڑھ جائے گی)۔ یہ ترتیب اس وقت کام کرتی ہے جب چاند کے ساتھ صرف ایک VM کام کر رہا ہو، جو کہ نایاب ہے۔ اگر چاند پر کئی VMs ہیں، تو آپ کو پیرامیٹر بھی بڑھانا ہوگا۔ Disk.SchedNumReqOutstanding (ہدایات  یہاں)۔ قطار کو بڑھا کر، آپ بالترتیب QAVG اور KAVG کم کرتے ہیں۔

لیکن پھر، پہلے HBA وینڈر سے دستاویزات پڑھیں اور لیب بینچ پر تبدیلیوں کی جانچ کریں۔

چاند تک قطار کا سائز SIOC (اسٹوریج I/O کنٹرول) میکانزم کی شمولیت سے متاثر ہو سکتا ہے۔ یہ سرورز پر چاند کی قطار کو متحرک طور پر تبدیل کرکے کلسٹر میں موجود تمام سرورز سے چاند تک یکساں رسائی فراہم کرتا ہے۔ یعنی، اگر میزبانوں میں سے ایک ایسا VM چلا رہا ہے جس کے لیے کارکردگی کی غیر متناسب مقدار کی ضرورت ہے (شور پڑوسی VM)، SIOC اس میزبان (DQLEN) پر چاند کی قطار کی لمبائی کو کم کر دیتا ہے۔ مزید تفصیلات یہاں.

ہم نے KAVG کو ترتیب دیا ہے، اب اس کے بارے میں تھوڑا سا ڈی اے وی جی. یہاں سب کچھ آسان ہے: ڈی اے وی جی بیرونی ماحول (ڈیٹا نیٹ ورک اور اسٹوریج سسٹم) کی طرف سے متعارف کرائی جانے والی تاخیر ہے۔ ہر جدید اور اتنے جدید اسٹوریج سسٹم کے اپنے پرفارمنس کاؤنٹر ہوتے ہیں۔ DAVG کے ساتھ مسائل کا تجزیہ کرنے کے لیے، ان کو دیکھنا سمجھ میں آتا ہے۔ اگر ESXi اور سٹوریج کی طرف سب کچھ ٹھیک ہے، تو ڈیٹا نیٹ ورک چیک کریں۔

کارکردگی کے مسائل سے بچنے کے لیے، اپنے اسٹوریج سسٹم کے لیے درست پاتھ سلیکشن پالیسی (PSP) کا انتخاب کریں۔ تقریباً تمام جدید سٹوریج سسٹم PSP راؤنڈ رابن (ALUA کے ساتھ یا اس کے بغیر، غیر متناسب منطقی یونٹ تک رسائی) کو سپورٹ کرتے ہیں۔ یہ پالیسی آپ کو اسٹوریج سسٹم کے تمام دستیاب راستے استعمال کرنے کی اجازت دیتی ہے۔ ALUA کے معاملے میں، صرف کنٹرولر کے راستے استعمال کیے جاتے ہیں جو چاند کا مالک ہے۔ ESXi پر تمام سٹوریج سسٹمز کے پہلے سے طے شدہ اصول نہیں ہیں جو راؤنڈ رابن پالیسی کو سیٹ کرتے ہیں۔ اگر آپ کے سٹوریج سسٹم کے لیے کوئی قاعدہ نہیں ہے، تو سٹوریج سسٹم مینوفیکچرر سے ایک پلگ ان استعمال کریں، جو کلسٹر میں موجود تمام میزبانوں پر ایک متعلقہ اصول بنائے گا، یا خود ایک اصول بنائے گا۔ تفصیلات یہاں

اس کے علاوہ، کچھ سٹوریج سسٹم مینوفیکچررز IOPS کی تعداد کو 1000 کی معیاری قیمت سے 1 میں تبدیل کرنے کی تجویز کرتے ہیں۔ ہمارے عمل میں، اس نے اسٹوریج سسٹم سے زیادہ کارکردگی کو "نچوڑنے" اور فیل اوور کے لیے درکار وقت کو نمایاں طور پر کم کرنا ممکن بنایا۔ کنٹرولر کی ناکامی یا اپ ڈیٹ کی صورت میں۔ وینڈر کی سفارشات کو چیک کریں، اور اگر کوئی تضاد نہیں ہے، تو اس پیرامیٹر کو تبدیل کرنے کی کوشش کریں۔ تفصیلات یہاں.

بنیادی ورچوئل مشین ڈسک سب سسٹم پرفارمنس کاؤنٹرز

vCenter میں ڈسک سب سسٹم پرفارمنس کاؤنٹر ڈیٹا اسٹور، ڈسک، ورچوئل ڈسک سیکشنز میں جمع کیے جاتے ہیں:

VMware vSphere میں VM کارکردگی کا تجزیہ۔ حصہ 3: ذخیرہ

کے حصے میں ڈیٹا اسٹور vSphere ڈسک اسٹوریجز (ڈیٹا اسٹورز) کے لیے میٹرکس موجود ہیں جن پر VM ڈسکیں واقع ہیں۔ یہاں آپ کو معیاری کاؤنٹر ملیں گے:

  • IOPS (اوسط پڑھنے/لکھنے کی درخواستیں فی سیکنڈ)، 
  • تھرو پٹ (پڑھنے/لکھنے کی شرح)، 
  • تاخیر (پڑھنا/لکھنا/سب سے زیادہ تاخیر)۔

اصولی طور پر، کاؤنٹرز کے ناموں سے سب کچھ واضح ہے۔ میں آپ کی توجہ ایک بار پھر اس حقیقت کی طرف مبذول کرواتا ہوں کہ یہاں کے اعدادوشمار کسی مخصوص VM (یا VM ڈسک) کے نہیں ہیں بلکہ پورے ڈیٹا اسٹور کے عمومی اعدادوشمار ہیں۔ میری رائے میں، ESXTOP میں ان اعدادوشمار کو دیکھنا زیادہ آسان ہے، کم از کم اس حقیقت کی بنیاد پر کہ پیمائش کی کم از کم مدت 2 سیکنڈ ہے۔

کے حصے میں ڈسک بلاک ڈیوائسز پر میٹرکس ہیں جو VM کے ذریعہ استعمال ہوتے ہیں۔ سمیشن قسم کے IOPS کے کاؤنٹرز ہیں (مقام کی پیمائش کے دوران ان پٹ/آؤٹ پٹ آپریشنز کی تعداد) اور بلاک رسائی سے متعلق کئی کاؤنٹرز (حکموں کو ختم کر دیا گیا، بس ری سیٹ)۔ میری رائے میں، اس معلومات کو ESXTOP میں دیکھنا بھی زیادہ آسان ہے۔

سیکشن ورچوئل ڈسک - VM ڈسک سب سسٹم کی کارکردگی کے مسائل کو تلاش کرنے کے نقطہ نظر سے سب سے زیادہ مفید۔ یہاں آپ ہر ورچوئل ڈسک کی کارکردگی دیکھ سکتے ہیں۔ یہ وہ معلومات ہے جو یہ سمجھنے کے لیے درکار ہے کہ آیا کسی خاص ورچوئل مشین میں کوئی مسئلہ ہے۔ I/O آپریشنز کی تعداد، پڑھنے/لکھنے والیوم اور تاخیر کے لیے معیاری کاؤنٹرز کے علاوہ، اس حصے میں مفید کاؤنٹرز ہیں جو بلاک سائز کو ظاہر کرتے ہیں: درخواست کا سائز پڑھیں/لکھیں۔

نیچے دی گئی تصویر میں VM ڈسک کی کارکردگی کا گراف ہے، جہاں آپ IOPS کی تعداد، لیٹنسی اور بلاک سائز دیکھ سکتے ہیں۔ 

VMware vSphere میں VM کارکردگی کا تجزیہ۔ حصہ 3: ذخیرہ

اگر SIOC فعال ہے تو آپ پورے ڈیٹا اسٹور کے لیے کارکردگی کی پیمائش بھی دیکھ سکتے ہیں۔ اوسط لیٹنسی اور IOPS پر بنیادی معلومات یہاں ہیں۔ پہلے سے طے شدہ طور پر، یہ معلومات صرف حقیقی وقت میں دیکھی جا سکتی ہیں۔

VMware vSphere میں VM کارکردگی کا تجزیہ۔ حصہ 3: ذخیرہ

ESXTOP

ESXTOP میں کئی اسکرینیں ہیں جو میزبان ڈسک کے سب سسٹم، انفرادی ورچوئل مشینوں اور ان کی ڈسکوں کے بارے میں معلومات فراہم کرتی ہیں۔

آئیے ورچوئل مشینوں کے بارے میں معلومات کے ساتھ شروع کریں۔ "ڈسک VM" اسکرین کو "v" کلید کے ساتھ بلایا جاتا ہے:

VMware vSphere میں VM کارکردگی کا تجزیہ۔ حصہ 3: ذخیرہ

NVDISK VM ڈسکوں کی تعداد ہے۔ ہر ڈسک کے لیے معلومات دیکھنے کے لیے، "e" دبائیں اور دلچسپی کے VM کا GID درج کریں۔

اس اسکرین پر باقی پیرامیٹرز کا مطلب ان کے ناموں سے واضح ہے۔

خرابیوں کا سراغ لگاتے وقت ایک اور کارآمد اسکرین ڈسک اڈاپٹر ہے۔ "d" کلید کے ذریعہ پکارا جاتا ہے (فیلڈز A, B, C, D, E, G کو نیچے کی تصویر میں منتخب کیا گیا ہے):

VMware vSphere میں VM کارکردگی کا تجزیہ۔ حصہ 3: ذخیرہ

این پی ٹی ایچ - اس اڈاپٹر سے نظر آنے والے چاندوں کے راستوں کی تعداد۔ اڈاپٹر پر ہر راستے کی معلومات حاصل کرنے کے لیے، "e" دبائیں اور اڈاپٹر کا نام درج کریں:

VMware vSphere میں VM کارکردگی کا تجزیہ۔ حصہ 3: ذخیرہ

AQLEN - اڈاپٹر پر قطار کا زیادہ سے زیادہ سائز۔

اس اسکرین پر بھی تاخیر کے کاؤنٹرز ہیں جن کے بارے میں میں نے اوپر بات کی ہے۔ KAVG/cmd، GAVG/cmd، DAVG/cmd، QAVG/cmd.

ڈسک ڈیوائس اسکرین، جسے "u" کلید دبانے سے کال کی جاتی ہے، انفرادی بلاک ڈیوائسز - چاندوں (فیلڈز A, B, F, G, I کو نیچے کی تصویر میں منتخب کیا گیا ہے) کے بارے میں معلومات فراہم کرتا ہے۔ یہاں آپ چاند کے لیے قطار کی حالت دیکھ سکتے ہیں۔

VMware vSphere میں VM کارکردگی کا تجزیہ۔ حصہ 3: ذخیرہ

DQLEN - بلاک ڈیوائس کے لیے قطار کا سائز۔
ACTV - ESXi کرنل میں I/O کمانڈز کی تعداد۔
QUED - قطار میں I/O کمانڈز کی تعداد۔
٪امریکن روپے - ACTV / DQLEN × 100%۔
لوڈ - (ACTV + QUED) / DQLEN۔

اگر %USD زیادہ ہے، تو آپ کو قطار بڑھانے پر غور کرنا چاہیے۔ قطار میں جتنے زیادہ کمانڈز ہوں گے، اتنا ہی زیادہ QAVG اور، اس کے مطابق، KAVG۔

آپ ڈسک ڈیوائس اسکرین پر یہ بھی دیکھ سکتے ہیں کہ آیا VAAI (vStorage API for Array Integration) اسٹوریج سسٹم پر چل رہا ہے۔ ایسا کرنے کے لیے، A اور O فیلڈز کو منتخب کریں۔

VAAI میکانزم آپ کو کام کا کچھ حصہ ہائپر وائزر سے براہ راست اسٹوریج سسٹم میں منتقل کرنے کی اجازت دیتا ہے، مثال کے طور پر، صفر کرنا، بلاکس کاپی کرنا یا بلاک کرنا۔

VMware vSphere میں VM کارکردگی کا تجزیہ۔ حصہ 3: ذخیرہ

جیسا کہ آپ اوپر کی تصویر میں دیکھ سکتے ہیں، VAAI اس سٹوریج سسٹم پر کام کرتا ہے: زیرو اور ATS پرائمیٹوز فعال طور پر استعمال ہوتے ہیں۔

ESXi پر ڈسک سب سسٹم کے ساتھ کام کو بہتر بنانے کے لیے نکات

  • بلاک سائز پر توجہ دیں۔
  • HBA پر قطار کا بہترین سائز سیٹ کریں۔
  • ڈیٹا اسٹورز پر SIOC کو فعال کرنا نہ بھولیں۔
  • اسٹوریج سسٹم بنانے والے کی سفارشات کے مطابق پی ایس پی کا انتخاب کریں۔
  • یقینی بنائیں کہ VAAI کام کر رہا ہے۔

مفید متعلقہ مضامین:http://www.yellow-bricks.com/2011/06/23/disk-schednumreqoutstanding-the-story/
http://www.yellow-bricks.com/2009/09/29/whats-that-alua-exactly/
http://www.yellow-bricks.com/2019/03/05/dqlen-changes-what-is-going-on/
https://www.codyhosterman.com/2017/02/understanding-vmware-esxi-queuing-and-the-flasharray/
https://www.codyhosterman.com/2018/03/what-is-the-latency-stat-qavg/
https://kb.vmware.com/s/article/1267
https://kb.vmware.com/s/article/1268
https://kb.vmware.com/s/article/1027901
https://kb.vmware.com/s/article/2069356
https://kb.vmware.com/s/article/2053628
https://kb.vmware.com/s/article/1003469
https://www.vmware.com/content/dam/digitalmarketing/vmware/en/pdf/techpaper/performance/vsphere-esxi-vcenter-server-67-performance-best-practices.pdf

ماخذ: www.habr.com

نیا تبصرہ شامل کریں