VMware vSphere-এ VM কর্মক্ষমতা বিশ্লেষণ। পার্ট 3: স্টোরেজ

VMware vSphere-এ VM কর্মক্ষমতা বিশ্লেষণ। পার্ট 3: স্টোরেজ

পার্ট 1. CPU সম্পর্কে
পার্ট 2. মেমরি সম্পর্কে

আজ আমরা vSphere-এ ডিস্ক সাবসিস্টেমের মেট্রিক্স বিশ্লেষণ করব। একটি স্টোরেজ সমস্যা একটি ধীর ভার্চুয়াল মেশিনের জন্য সবচেয়ে সাধারণ কারণ। যদি, সিপিইউ এবং র‌্যামের ক্ষেত্রে, হাইপারভাইজার স্তরে সমস্যা সমাধান শেষ হয়, তবে ডিস্কে সমস্যা থাকলে, আপনাকে ডেটা নেটওয়ার্ক এবং স্টোরেজ সিস্টেমের সাথে মোকাবিলা করতে হতে পারে।

আমি স্টোরেজ সিস্টেমে ব্লক অ্যাক্সেসের উদাহরণ ব্যবহার করে বিষয়টি নিয়ে আলোচনা করব, যদিও ফাইল অ্যাক্সেসের জন্য কাউন্টারগুলি প্রায় একই।

তত্ত্ব একটি বিট

ভার্চুয়াল মেশিনের ডিস্ক সাবসিস্টেমের কর্মক্ষমতা সম্পর্কে কথা বলার সময়, লোকেরা সাধারণত তিনটি আন্তঃসম্পর্কিত পরামিতিগুলিতে মনোযোগ দেয়:

  • ইনপুট/আউটপুট অপারেশনের সংখ্যা (ইনপুট/আউটপুট অপারেশন পার সেকেন্ড, IOPS);
  • থ্রুপুট;
  • ইনপুট/আউটপুট অপারেশনের বিলম্ব (লেটেন্সি)।

IOPS এর সংখ্যা র্যান্ডম ওয়ার্কলোডের জন্য সাধারণত গুরুত্বপূর্ণ: বিভিন্ন জায়গায় অবস্থিত ডিস্ক ব্লকগুলিতে অ্যাক্সেস। এই ধরনের লোডের একটি উদাহরণ হতে পারে ডাটাবেস, ব্যবসায়িক অ্যাপ্লিকেশন (ERP, CRM) ইত্যাদি।

ব্যান্ডউইথ অনুক্রমিক লোডের জন্য গুরুত্বপূর্ণ: একের পর এক অবস্থিত ব্লকগুলিতে অ্যাক্সেস। উদাহরণস্বরূপ, ফাইল সার্ভার (কিন্তু সবসময় নয়) এবং ভিডিও নজরদারি সিস্টেমগুলি এই ধরনের লোড তৈরি করতে পারে।

থ্রুপুট নিম্নরূপ I/O অপারেশনের সংখ্যার সাথে সম্পর্কিত:

থ্রুপুট = IOPS * ব্লকের আকার, যেখানে ব্লকের আকার হল ব্লকের আকার।

ব্লক আকার একটি মোটামুটি গুরুত্বপূর্ণ বৈশিষ্ট্য. ESXi-এর আধুনিক সংস্করণগুলি 32 KB পর্যন্ত আকারের ব্লকের অনুমতি দেয়। যদি ব্লকটি আরও বড় হয় তবে এটি কয়েকটিতে বিভক্ত। সমস্ত স্টোরেজ সিস্টেম এত বড় ব্লকের সাথে দক্ষতার সাথে কাজ করতে পারে না, তাই ESXi অ্যাডভান্সড সেটিংসে একটি DiskMaxIOSize প্যারামিটার রয়েছে। এটি ব্যবহার করে, আপনি হাইপারভাইজার দ্বারা এড়িয়ে যাওয়া সর্বাধিক ব্লকের আকার হ্রাস করতে পারেন (আরো বিশদ এখানে) এই পরামিতি পরিবর্তন করার আগে, আমি সুপারিশ করি যে আপনি স্টোরেজ সিস্টেম প্রস্তুতকারকের সাথে পরামর্শ করুন বা অন্তত একটি পরীক্ষাগার বেঞ্চে পরিবর্তনগুলি পরীক্ষা করুন। 

একটি বড় ব্লক আকার স্টোরেজ কর্মক্ষমতা উপর একটি ক্ষতিকারক প্রভাব থাকতে পারে. IOPS এবং থ্রুপুট সংখ্যা তুলনামূলকভাবে ছোট হলেও, একটি বড় ব্লকের আকারের সাথে উচ্চ বিলম্ব লক্ষ্য করা যেতে পারে। অতএব, এই পরামিতি মনোযোগ দিন।

অদৃশ্যতা - সবচেয়ে আকর্ষণীয় কর্মক্ষমতা পরামিতি। একটি ভার্চুয়াল মেশিনের I/O লেটেন্সি এর মধ্যে থাকে:

  • হাইপারভাইজারের ভিতরে বিলম্ব (KAVG, গড় কার্নেল মিলিসেক/রিড);
  • ডেটা নেটওয়ার্ক এবং স্টোরেজ সিস্টেম দ্বারা প্রদত্ত বিলম্ব (DAVG, গড় ড্রাইভার MilliSec/Command)।

গেস্ট OS (GAVG, গড় গেস্ট মিলিসেক/কমান্ড) তে দৃশ্যমান মোট লেটেন্সি হল KAVG এবং DAVG এর সমষ্টি৷

GAVG এবং DAVG পরিমাপ করা হয় এবং KAVG গণনা করা হয়: GAVG–DAVG।

VMware vSphere-এ VM কর্মক্ষমতা বিশ্লেষণ। পার্ট 3: স্টোরেজ
উৎস

এর একটি ঘনিষ্ঠ কটাক্ষপাত করা যাক কেএভিজি. স্বাভাবিক ক্রিয়াকলাপের সময়, KAVG শূন্যের দিকে ঝোঁক বা কমপক্ষে DAVG থেকে অনেক কম হওয়া উচিত। KAVG প্রত্যাশিতভাবে উচ্চ যেখানে আমি জানি একমাত্র ক্ষেত্রে VM ডিস্কে IOPS সীমা। এই ক্ষেত্রে, আপনি যখন সীমা অতিক্রম করার চেষ্টা করবেন, তখন KAVG বাড়বে।

KAVG-এর সবচেয়ে উল্লেখযোগ্য উপাদান হল QAVG - হাইপারভাইজারের ভিতরে প্রসেসিং কিউ সময়। KAVG এর অবশিষ্ট উপাদানগুলি নগণ্য।

ডিস্ক অ্যাডাপ্টার ড্রাইভারের সারি এবং চাঁদের সারির একটি নির্দিষ্ট আকার রয়েছে। অত্যন্ত লোড করা পরিবেশের জন্য, এই আকার বাড়ানোর জন্য এটি কার্যকর হতে পারে। এটা হল অ্যাডাপ্টার ড্রাইভারে কীভাবে সারি বাড়ানো যায় তা বর্ণনা করে (একই সময়ে চাঁদের সারি বাড়বে)। এই সেটিংটি কাজ করে যখন শুধুমাত্র একটি VM চাঁদের সাথে কাজ করে, যা বিরল। যদি চাঁদে বেশ কয়েকটি ভিএম থাকে তবে আপনাকে অবশ্যই প্যারামিটার বাড়াতে হবে Disk.SchedNumReqOutstanding (নির্দেশনা  এখানে) সারি বাড়িয়ে, আপনি যথাক্রমে QAVG এবং KAVG হ্রাস করেন।

কিন্তু আবার, প্রথমে HBA বিক্রেতার কাছ থেকে ডকুমেন্টেশন পড়ুন এবং একটি ল্যাব বেঞ্চে পরিবর্তনগুলি পরীক্ষা করুন।

চাঁদের সারির আকার SIOC (স্টোরেজ I/O কন্ট্রোল) প্রক্রিয়ার অন্তর্ভুক্তির দ্বারা প্রভাবিত হতে পারে। এটি গতিশীলভাবে সার্ভারে চাঁদের সারি পরিবর্তন করে ক্লাস্টারের সমস্ত সার্ভার থেকে চাঁদে অভিন্ন অ্যাক্সেস সরবরাহ করে। অর্থাৎ, যদি হোস্টগুলির মধ্যে একটি এমন একটি VM চালায় যার জন্য একটি অসামঞ্জস্যপূর্ণ পরিমাণ কর্মক্ষমতা প্রয়োজন (কোলাহলপূর্ণ প্রতিবেশী VM), SIOC এই হোস্টে (DQLEN) চাঁদের সারির দৈর্ঘ্য কমিয়ে দেয়। আরো বিস্তারিত এখানে.

আমরা KAVG সাজিয়েছি, এখন একটু সম্পর্কে DAVG. এখানে সবকিছুই সহজ: DAVG হল বাহ্যিক পরিবেশ (ডেটা নেটওয়ার্ক এবং স্টোরেজ সিস্টেম) দ্বারা প্রবর্তিত বিলম্ব। প্রতিটি আধুনিক এবং এত আধুনিক স্টোরেজ সিস্টেমের নিজস্ব কর্মক্ষমতা কাউন্টার রয়েছে। DAVG-এর সাথে সমস্যাগুলি বিশ্লেষণ করার জন্য, সেগুলি দেখার অর্থবোধক। ESXi এবং স্টোরেজ সাইডে সবকিছু ঠিক থাকলে, ডাটা নেটওয়ার্ক চেক করুন।

কর্মক্ষমতা সমস্যা এড়াতে, আপনার স্টোরেজ সিস্টেমের জন্য সঠিক পথ নির্বাচন নীতি (PSP) চয়ন করুন। প্রায় সব আধুনিক স্টোরেজ সিস্টেম পিএসপি রাউন্ড-রবিন সমর্থন করে (ALUA, অ্যাসিমেট্রিক লজিক্যাল ইউনিট অ্যাক্সেস সহ বা ছাড়া)। এই নীতি আপনাকে স্টোরেজ সিস্টেমে সমস্ত উপলব্ধ পথ ব্যবহার করার অনুমতি দেয়। ALUA-এর ক্ষেত্রে, শুধুমাত্র চাঁদের মালিক নিয়ামকের পাথ ব্যবহার করা হয়। ESXi-এর সমস্ত স্টোরেজ সিস্টেমের ডিফল্ট নিয়ম নেই যা রাউন্ড-রবিন নীতি সেট করে। আপনার স্টোরেজ সিস্টেমের জন্য কোন নিয়ম না থাকলে, স্টোরেজ সিস্টেম প্রস্তুতকারকের থেকে একটি প্লাগইন ব্যবহার করুন, যা ক্লাস্টারের সমস্ত হোস্টের জন্য একটি অনুরূপ নিয়ম তৈরি করবে, অথবা নিজে একটি নিয়ম তৈরি করবে। বিস্তারিত এখানে

এছাড়াও, কিছু স্টোরেজ সিস্টেম নির্মাতারা প্রতি পাথে IOPS-এর সংখ্যা 1000-এর আদর্শ মান থেকে 1-তে পরিবর্তন করার পরামর্শ দেন। আমাদের অনুশীলনে, এটি স্টোরেজ সিস্টেমের বাইরে আরও কর্মক্ষমতা "নিচু করা" এবং ফেইলওভারের জন্য প্রয়োজনীয় সময় উল্লেখযোগ্যভাবে হ্রাস করা সম্ভব করেছে। একটি কন্ট্রোলার ব্যর্থতা বা আপডেটের ক্ষেত্রে। বিক্রেতার সুপারিশ পরীক্ষা করুন, এবং যদি কোন contraindication না থাকে, এই পরামিতি পরিবর্তন করার চেষ্টা করুন। বিস্তারিত এখানে.

বেসিক ভার্চুয়াল মেশিন ডিস্ক সাবসিস্টেম কর্মক্ষমতা কাউন্টার

ভিসেন্টারে ডিস্ক সাবসিস্টেম কর্মক্ষমতা কাউন্টারগুলি ডেটাস্টোর, ডিস্ক, ভার্চুয়াল ডিস্ক বিভাগে সংগ্রহ করা হয়:

VMware vSphere-এ VM কর্মক্ষমতা বিশ্লেষণ। পার্ট 3: স্টোরেজ

অধ্যায় অস্ত্রোপচার vSphere ডিস্ক স্টোরেজের (ডেটাস্টোর) মেট্রিক্স আছে যেখানে VM ডিস্কগুলি অবস্থিত। এখানে আপনি এর জন্য স্ট্যান্ডার্ড কাউন্টার পাবেন:

  • IOPS (প্রতি সেকেন্ডে গড় পড়ার/লিখনের অনুরোধ), 
  • থ্রুপুট (পঠন/লেখার হার), 
  • বিলম্ব (পড়ুন/লিখুন/সর্বোচ্চ বিলম্ব)।

নীতিগতভাবে, কাউন্টারগুলির নাম থেকে সবকিছু পরিষ্কার। আমাকে আবারও আপনার দৃষ্টি আকর্ষণ করা যাক যে এখানে পরিসংখ্যানগুলি একটি নির্দিষ্ট VM (বা VM ডিস্ক) এর জন্য নয়, তবে সমগ্র ডেটাস্টোরের জন্য সাধারণ পরিসংখ্যান। আমার মতে, ESXTOP-এ এই পরিসংখ্যানগুলি দেখা আরও সুবিধাজনক, অন্তত এই সত্যের উপর ভিত্তি করে যে সর্বনিম্ন পরিমাপের সময়কাল 2 সেকেন্ড।

অধ্যায় ডিস্ক VM দ্বারা ব্যবহৃত ব্লক ডিভাইসে মেট্রিক আছে। যোগফল টাইপের আইওপিএসের জন্য কাউন্টার রয়েছে (পরিমাপের সময়কালে ইনপুট/আউটপুট অপারেশনের সংখ্যা) এবং ব্লক অ্যাক্সেস সম্পর্কিত বেশ কয়েকটি কাউন্টার (কমান্ড বাতিল করা হয়েছে, বাস রিসেট)। আমার মতে, ESXTOP-এ এই তথ্যটি দেখতে আরও সুবিধাজনক।

অধ্যায় ভার্চুয়াল ডিস্ক - ভিএম ডিস্ক সাবসিস্টেমের কর্মক্ষমতা সমস্যাগুলি খুঁজে বের করার দৃষ্টিকোণ থেকে সবচেয়ে দরকারী। এখানে আপনি প্রতিটি ভার্চুয়াল ডিস্কের কর্মক্ষমতা দেখতে পারেন। একটি নির্দিষ্ট ভার্চুয়াল মেশিনে সমস্যা আছে কিনা তা বোঝার জন্য এই তথ্যটি প্রয়োজন। I/O অপারেশন, রিড/রাইট ভলিউম এবং বিলম্বের জন্য স্ট্যান্ডার্ড কাউন্টার ছাড়াও, এই বিভাগে দরকারী কাউন্টার রয়েছে যা ব্লকের আকার দেখায়: রিড/রাইট রিকোয়েস্ট সাইজ।

নীচের ছবিতে VM ডিস্কের কর্মক্ষমতার একটি গ্রাফ রয়েছে, যেখানে আপনি IOPS সংখ্যা, লেটেন্সি এবং ব্লকের আকার দেখতে পারেন৷ 

VMware vSphere-এ VM কর্মক্ষমতা বিশ্লেষণ। পার্ট 3: স্টোরেজ

SIOC সক্ষম থাকলে আপনি সমগ্র ডেটাস্টোরের কর্মক্ষমতা মেট্রিক্সও দেখতে পারেন। এখানে গড় লেটেন্সি এবং IOPS-এর প্রাথমিক তথ্য রয়েছে৷ ডিফল্টরূপে, এই তথ্য শুধুমাত্র রিয়েল টাইমে দেখা যাবে।

VMware vSphere-এ VM কর্মক্ষমতা বিশ্লেষণ। পার্ট 3: স্টোরেজ

ESXTOP

ESXTOP-এর বেশ কিছু স্ক্রিন রয়েছে যা হোস্ট ডিস্ক সাবসিস্টেম, স্বতন্ত্র ভার্চুয়াল মেশিন এবং তাদের ডিস্কের তথ্য প্রদান করে।

ভার্চুয়াল মেশিনের তথ্য দিয়ে শুরু করা যাক। "ডিস্ক VM" স্ক্রীনটিকে "v" কী দিয়ে ডাকা হয়:

VMware vSphere-এ VM কর্মক্ষমতা বিশ্লেষণ। পার্ট 3: স্টোরেজ

NVDISK VM ডিস্কের সংখ্যা। প্রতিটি ডিস্কের তথ্য দেখতে, "e" টিপুন এবং আগ্রহের VM-এর GID লিখুন।

এই পর্দায় অবশিষ্ট পরামিতিগুলির অর্থ তাদের নাম থেকে স্পষ্ট।

সমস্যা সমাধানের সময় আরেকটি দরকারী পর্দা হল ডিস্ক অ্যাডাপ্টার। "d" কী দ্বারা কল করা হয়েছে (ক্ষেত্র A, B, C, D, E, G নীচের ছবিতে নির্বাচিত হয়েছে):

VMware vSphere-এ VM কর্মক্ষমতা বিশ্লেষণ। পার্ট 3: স্টোরেজ

NPTH - এই অ্যাডাপ্টার থেকে দৃশ্যমান চাঁদের পথের সংখ্যা। অ্যাডাপ্টারের প্রতিটি পথের জন্য তথ্য পেতে, "e" টিপুন এবং অ্যাডাপ্টারের নাম লিখুন:

VMware vSphere-এ VM কর্মক্ষমতা বিশ্লেষণ। পার্ট 3: স্টোরেজ

AQLEN - অ্যাডাপ্টারের সর্বোচ্চ সারির আকার।

এছাড়াও এই স্ক্রিনে বিলম্ব কাউন্টার রয়েছে যা আমি উপরে বলেছি: KAVG/cmd, GAVG/cmd, DAVG/cmd, QAVG/cmd.

ডিস্ক ডিভাইস স্ক্রীন, যা "u" কী টিপে কল করা হয়, পৃথক ব্লক ডিভাইসগুলির তথ্য প্রদান করে - চাঁদ (ক্ষেত্র A, B, F, G, I নীচের ছবিতে নির্বাচিত হয়েছে)। এখানে আপনি চাঁদের জন্য সারির অবস্থা দেখতে পারেন।

VMware vSphere-এ VM কর্মক্ষমতা বিশ্লেষণ। পার্ট 3: স্টোরেজ

DQLEN - একটি ব্লক ডিভাইসের জন্য সারির আকার।
ACTV - ESXi কার্নেলে I/O কমান্ডের সংখ্যা।
QUED - সারিতে থাকা I/O কমান্ডের সংখ্যা।
%আমেরিকান ডলার - ACTV / DQLEN × 100%।
বোঝা - (ACTV + QUED) / DQLEN।

যদি % USD বেশি হয়, তাহলে আপনার সারি বাড়ানোর কথা বিবেচনা করা উচিত। সারিতে যত বেশি কমান্ড থাকবে, তত বেশি QAVG এবং সেই অনুযায়ী, KAVG।

আপনি ডিস্ক ডিভাইসের স্ক্রিনে দেখতে পারেন যে VAAI (অ্যারে ইন্টিগ্রেশনের জন্য vStorage API) স্টোরেজ সিস্টেমে চলছে কিনা। এটি করতে, A এবং O ক্ষেত্রগুলি নির্বাচন করুন।

VAAI প্রক্রিয়া আপনাকে হাইপারভাইজার থেকে সরাসরি স্টোরেজ সিস্টেমে কাজের অংশ স্থানান্তর করতে দেয়, উদাহরণস্বরূপ, শূন্য করা, ব্লকগুলি অনুলিপি করা বা ব্লক করা।

VMware vSphere-এ VM কর্মক্ষমতা বিশ্লেষণ। পার্ট 3: স্টোরেজ

আপনি উপরের ছবিতে দেখতে পাচ্ছেন, VAAI এই স্টোরেজ সিস্টেমে কাজ করে: জিরো এবং এটিএস আদিম সক্রিয়ভাবে ব্যবহৃত হয়।

ESXi-এ ডিস্ক সাবসিস্টেমের সাথে কাজ অপ্টিমাইজ করার জন্য টিপস

  • ব্লক আকার মনোযোগ দিন।
  • HBA তে সর্বোত্তম সারি আকার সেট করুন।
  • ডেটাস্টোরে SIOC সক্ষম করতে ভুলবেন না।
  • স্টোরেজ সিস্টেম প্রস্তুতকারকের সুপারিশ অনুসারে একটি পিএসপি চয়ন করুন।
  • VAAI কাজ করছে তা নিশ্চিত করুন।

দরকারী সম্পর্কিত নিবন্ধ:http://www.yellow-bricks.com/2011/06/23/disk-schednumreqoutstanding-the-story/
http://www.yellow-bricks.com/2009/09/29/whats-that-alua-exactly/
http://www.yellow-bricks.com/2019/03/05/dqlen-changes-what-is-going-on/
https://www.codyhosterman.com/2017/02/understanding-vmware-esxi-queuing-and-the-flasharray/
https://www.codyhosterman.com/2018/03/what-is-the-latency-stat-qavg/
https://kb.vmware.com/s/article/1267
https://kb.vmware.com/s/article/1268
https://kb.vmware.com/s/article/1027901
https://kb.vmware.com/s/article/2069356
https://kb.vmware.com/s/article/2053628
https://kb.vmware.com/s/article/1003469
https://www.vmware.com/content/dam/digitalmarketing/vmware/en/pdf/techpaper/performance/vsphere-esxi-vcenter-server-67-performance-best-practices.pdf

উত্স: www.habr.com

একটি মন্তব্য জুড়ুন