Анализа перформанси ВМ у ВМваре вСпхере. Део 3: Складиштење

Анализа перформанси ВМ у ВМваре вСпхере. Део 3: Складиштење

Део 1. О ЦПУ-у
Део 2. О памћењу

Данас ћемо анализирати метрику подсистема диска у вСпхере. Проблем са складиштењем је најчешћи разлог за спору виртуелну машину. Ако се, у случају ЦПУ-а и РАМ-а, решавање проблема заврши на нивоу хипервизора, онда ако постоје проблеми са диском, можда ћете морати да се бавите мрежом података и системом за складиштење података.

Разговараћу о овој теми користећи пример блокирања приступа системима за складиштење, иако су за приступ фајловима бројачи приближно исти.

Мало теорије

Када се говори о перформансама дисковног подсистема виртуелних машина, људи обично обраћају пажњу на три међусобно повезана параметра:

  • број улазно/излазних операција (Инпут/Оутпут Оператионс Пер Сецонд, ИОПС);
  • пропусност;
  • кашњење улазно/излазних операција (латенција).

Број ИОПС обично важно за случајна оптерећења: приступ блоковима диска који се налазе на различитим местима. Пример таквог оптерећења могу бити базе података, пословне апликације (ЕРП, ЦРМ) итд.

Пропусност важно за узастопна оптерећења: приступ блоковима који се налазе један за другим. На пример, сервери датотека (али не увек) и системи за видео надзор могу да генеришу такво оптерећење.

Проток је повезан са бројем И/О операција на следећи начин:

Проток = ИОПС * Величина блока, где је величина блока величина блока.

Величина блока је прилично важна карактеристика. Модерне верзије ЕСКСи дозвољавају блокове величине до 32 КБ. Ако је блок још већи, подељен је на неколико. Не могу сви системи за складиштење ефикасно да раде са тако великим блоковима, тако да постоји параметар ДискМакИОСизе у ЕСКСи напредним подешавањима. Користећи га, можете смањити максималну величину блока коју хипервизор прескочи (више детаља овде). Пре него што промените овај параметар, препоручујем да се консултујете са произвођачем система за складиштење или бар тестирате промене на лабораторијском столу. 

Велика величина блока може имати штетан утицај на перформансе складиштења. Чак и ако су број ИОПС-а и пропусност релативно мали, велике латенције се могу приметити са великом величином блока. Стога, обратите пажњу на овај параметар.

Латентност – најзанимљивији параметар перформанси. Улазно/излазно кашњење за виртуелну машину састоји се од:

  • кашњења унутар хипервизора (КАВГ, Авераге Кернел МиллиСец/Реад);
  • кашњење које обезбеђује мрежа података и систем за складиштење (ДАВГ, Авераге Дривер МиллиСец/Цомманд).

Укупна латенција која је видљива у гостујућем ОС-у (ГАВГ, Авераге Гуест МиллиСец/Цомманд) је збир КАВГ и ДАВГ.

ГАВГ и ДАВГ се мере и КАВГ се израчунава: ГАВГ–ДАВГ.

Анализа перформанси ВМ у ВМваре вСпхере. Део 3: Складиштење
Извор

Погледајмо ближе КАВГ. Током нормалног рада, КАВГ би требало да тежи нули или барем да буде много мањи од ДАВГ. Једини случај за који знам где је КАВГ очекивано висок је ограничење ИОПС-а на ВМ диску. У овом случају, када покушате да прекорачите ограничење, КАВГ ће се повећати.

Најзначајнија компонента КАВГ-а је КАВГ – време чекања за обраду унутар хипервизора. Преостале компоненте КАВГ-а су занемарљиве.

Ред у драјверу адаптера диска и ред до месеца има фиксну величину. За окружења са високим оптерећењем, може бити корисно повећати ову величину. Овде описује како повећати редове у драјверу адаптера (истовремено ће се повећати ред до месеца). Ова поставка функционише када само један ВМ ради са месецом, што је ретко. Ако постоји неколико ВМ-ова на Месецу, такође морате повећати параметар Диск.СцхедНумРекОутстандинг (упутства  овде). Повећањем реда, смањујете КАВГ и КАВГ респективно.

Али опет, прво прочитајте документацију од ХБА добављача и тестирајте промене на лабораторијској клупи.

На величину реда до Месеца може утицати укључивање СИОЦ (Стораге И/О Цонтрол) механизма. Обезбеђује уједначен приступ Месецу са свих сервера у кластеру тако што динамички мења ред до Месеца на серверима. То јест, ако један од хостова покреће ВМ који захтева непропорционалну количину перформанси (бучни сусед ВМ), СИОЦ смањује дужину реда до месеца на овом хосту (ДКЛЕН). Детаљније овде.

Средили смо КАВГ, сада мало о томе ДАВГ. Овде је све једноставно: ДАВГ је кашњење које уводи спољашње окружење (мрежа података и систем за складиштење). Сваки модеран и не тако модеран систем за складиштење има своје бројаче перформанси. Да бисте анализирали проблеме са ДАВГ-ом, има смисла погледати их. Ако је све у реду на страни ЕСКСи и складишта, проверите мрежу података.

Да бисте избегли проблеме са перформансама, изаберите исправну политику избора путање (ПСП) за ваш систем складиштења. Скоро сви модерни системи за складиштење подржавају ПСП Роунд-Робин (са или без АЛУА, Асиметрични приступ логичкој јединици). Ова политика вам омогућава да користите све доступне путање до система складиштења. У случају АЛУА, користе се само путеви до контролера који поседује месец. Немају сви системи за складиштење на ЕСКСи-у подразумевана правила која постављају Роунд-Робин политику. Ако не постоји правило за ваш систем складиштења, користите додатак произвођача система за складиштење који ће креирати одговарајуће правило за све хостове у кластеру или сами креирајте правило. Детаљи овде

Такође, неки произвођачи система за складиштење препоручују промену броја ИОПС-а по путањи са стандардне вредности од 1000 на 1. У нашој пракси, ово је омогућило да се „исцеди” више перформанси из система за складиштење и значајно смањи време потребно за прелазак на грешку. у случају квара или ажурирања контролера. Проверите препоруке продавца, а ако нема контраиндикација, покушајте да промените овај параметар. Детаљи овде.

Бројачи перформанси подсистема диска основне виртуелне машине

Бројачи перформанси подсистема диска у вЦентер-у се прикупљају у одељцима Датасторе, Диск, Виртуал Диск:

Анализа перформанси ВМ у ВМваре вСпхере. Део 3: Складиштење

У секцији Датасторе постоје метрике за вСпхере дискове (складишта података) на којима се налазе ВМ дискови. Овде ћете наћи стандардне бројаче за:

  • ИОПС (просечан број захтева за читање/писање у секунди), 
  • проток (брзина читања/писања), 
  • кашњења (читање/писање/највећа латенција).

У принципу, све је јасно из назива бројача. Дозволите ми да вам још једном скренем пажњу на чињеницу да овде статистика није за одређени ВМ (или ВМ диск), већ општа статистика за читаво складиште података. По мом мишљењу, згодније је погледати ову статистику у ЕСКСТОП-у, барем на основу чињенице да је минимални период мерења тамо 2 секунде.

У секцији Диск постоје метрике на блок уређајима које користи ВМ. Постоје бројачи за ИОПС типа сумирања (број улазно/излазних операција током периода мерења) и неколико бројача који се односе на блокирање приступа (наредбе прекинуте, магистрала се ресетује). По мом мишљењу, такође је згодније видети ове информације у ЕСКСТОП-у.

Одељак Виртуелни диск – најкориснији са становишта проналажења проблема са перформансама подсистема ВМ диска. Овде можете видети перформансе за сваки виртуелни диск. Ове информације су потребне да би се разумело да ли одређена виртуелна машина има проблем. Поред стандардних бројача за број И/О операција, волумен читања/писања и кашњења, овај одељак садржи корисне бројаче који показују величину блока: Величина захтева за читање/писање.

На слици испод је графикон перформанси ВМ диска, где можете видети број ИОПС, кашњење и величину блока. 

Анализа перформанси ВМ у ВМваре вСпхере. Део 3: Складиштење

Такође можете да видите метрику учинка за целу складиште података ако је СИОЦ омогућен. Ево основних информација о просечном кашњењу и ИОПС. Подразумевано, ове информације се могу видети само у реалном времену.

Анализа перформанси ВМ у ВМваре вСпхере. Део 3: Складиштење

ЕСКСТОП

ЕСКСТОП има неколико екрана који пружају информације о подсистему хост диска у целини, појединачним виртуелним машинама и њиховим дисковима.

Почнимо са информацијама о виртуелним машинама. Екран „Диск ВМ“ се позива помоћу тастера „в“:

Анализа перформанси ВМ у ВМваре вСпхере. Део 3: Складиштење

НВДИСК је број ВМ дискова. Да бисте видели информације за сваки диск, притисните „е“ и унесите ГИД ВМ-а од интереса.

Значење преосталих параметара на овом екрану јасно је из њихових назива.

Још један користан екран при решавању проблема је Диск адаптер. Позива се тастером "д" (поља А,Б,Ц,Д,Е,Г су изабрана на слици испод):

Анализа перформанси ВМ у ВМваре вСпхере. Део 3: Складиштење

НПТХ – број путева до месеца који су видљиви са овог адаптера. Да бисте добили информације за сваку путању на адаптеру, притисните „е“ и унесите назив адаптера:

Анализа перформанси ВМ у ВМваре вСпхере. Део 3: Складиштење

АКЛЕН – максимална величина реда на адаптеру.

Такође на овом екрану су бројачи кашњења о којима сам горе говорио: КАВГ/цмд, ГАВГ/цмд, ДАВГ/цмд, КАВГ/цмд.

Екран Диск уређаја, који се позива притиском на тастер „у“, пружа информације о појединачним блок уређајима - месецима (поља А, Б, Ф, Г, И су изабрана на слици испод). Овде можете видети статус у реду за месеце.

Анализа перформанси ВМ у ВМваре вСпхере. Део 3: Складиштење

ДКЛЕН – величина реда за блок уређај.
АЦТВ – број И/О команди у ЕСКСи кернелу.
КУЕД – број И/О команди у реду.
%АМЕРИЧКИ ДОЛАР – АЦТВ / ДКЛЕН × 100%.
ЛОАД – (АЦТВ + КУЕД) / ДКЛЕН.

Ако је %УСД висок, требало би да размислите о повећању реда. Што је више команди у реду, већи је КАВГ и, сходно томе, КАВГ.

Такође можете видети на екрану Диск уређаја да ли је ВААИ (вСтораге АПИ за интеграцију низа) покренут на систему за складиштење података. Да бисте то урадили, изаберите поља А и О.

ВААИ механизам вам омогућава да пренесете део посла са хипервизора директно на систем за складиштење, на пример, нулирање, копирање блокова или блокирање.

Анализа перформанси ВМ у ВМваре вСпхере. Део 3: Складиштење

Као што можете видети на слици изнад, ВААИ ради на овом систему за складиштење: активно се користе Зеро и АТС примитиви.

Савети за оптимизацију рада са подсистемом диска на ЕСКСи

  • Обратите пажњу на величину блока.
  • Подесите оптималну величину реда на ХБА.
  • Не заборавите да омогућите СИОЦ на складиштима података.
  • Изаберите ПСП у складу са препорукама произвођача система за складиштење података.
  • Уверите се да ВААИ ради.

Корисни повезани чланци:http://www.yellow-bricks.com/2011/06/23/disk-schednumreqoutstanding-the-story/
http://www.yellow-bricks.com/2009/09/29/whats-that-alua-exactly/
http://www.yellow-bricks.com/2019/03/05/dqlen-changes-what-is-going-on/
https://www.codyhosterman.com/2017/02/understanding-vmware-esxi-queuing-and-the-flasharray/
https://www.codyhosterman.com/2018/03/what-is-the-latency-stat-qavg/
https://kb.vmware.com/s/article/1267
https://kb.vmware.com/s/article/1268
https://kb.vmware.com/s/article/1027901
https://kb.vmware.com/s/article/2069356
https://kb.vmware.com/s/article/2053628
https://kb.vmware.com/s/article/1003469
https://www.vmware.com/content/dam/digitalmarketing/vmware/en/pdf/techpaper/performance/vsphere-esxi-vcenter-server-67-performance-best-practices.pdf

Извор: ввв.хабр.цом

Додај коментар