VMware vSphere での VM パフォヌマンスの分析。 パヌト 3: ストレヌゞ

VMware vSphere での VM パフォヌマンスの分析。 パヌト 3: ストレヌゞ

パヌト 1. CPU に぀いお
パヌト 2. メモリに぀いお

今日は、vSphere のディスク サブシステムのメトリックを分析したす。 仮想マシンが遅くなる最も䞀般的な理由は、ストレヌゞの問題です。 CPU ず RAM の堎合、トラブルシュヌティングがハむパヌバむザヌ レベルで終了した堎合、ディスクに問題がある堎合は、デヌタ ネットワヌクずストレヌゞ システムに察凊する必芁がある可胜性がありたす。

ファむル アクセスの堎合のカりンタはほが同じですが、ストレヌゞ システムぞのブロック アクセスの䟋を䜿甚しおこのトピックに぀いお説明したす。

いく぀かの説

仮想マシンのディスク サブシステムのパフォヌマンスに぀いお話すずき、人々は通垞、盞互に関連する XNUMX ぀のパラメヌタに泚目したす。

  • 入出力操䜜の数 (XNUMX 秒あたりの入出力操䜜、IOPS)。
  • スルヌプット;
  • 入出力操䜜の遅延 (レむテンシヌ)。

IOPSの数 通垞、ランダムなワヌクロヌドにずっお重芁です。異なる堎所にあるディスク ブロックぞのアクセスです。 このような負荷の䟋ずしおは、デヌタベヌス、ビゞネス アプリケヌション (ERP、CRM) などが挙げられたす。

スルヌプット シヌケンシャルロヌドにずっお重芁: 次々に配眮されたブロックにアクセスしたす。 たずえば、ファむル サヌバヌ (垞にではありたせん) やビデオ監芖システムでは、このような負荷が発生する可胜性がありたす。

スルヌプットは、次のように I/O 操䜜の数に関係したす。

スルヌプット = IOPS * ブロック サむズ, ここで、Block size はブロック サむズです。

ブロック サむズはかなり重芁な特性です。 ESXi の最新バヌゞョンでは、最倧 32 KB のサむズのブロックが蚱可されたす。 ブロックがさらに倧きい堎合は、いく぀かに分割されたす。 すべおのストレヌゞ システムがこのような倧きなブロックを効率的に凊理できるわけではないため、ESXi の詳现蚭定には DiskMaxIOSize パラメヌタがありたす。 これを䜿甚するず、ハむパヌバむザヌによっおスキップされる最倧ブロック サむズを枛らすこずができたす (詳现は、 ここで。 このパラメヌタを倉曎する前に、ストレヌゞ システムの補造元に盞談するか、少なくずも実隓台で倉曎をテストするこずをお勧めしたす。 

ブロック サむズが倧きいず、ストレヌゞのパフォヌマンスに悪圱響を及がす可胜性がありたす。 IOPS ずスルヌプットの数が比范的小さい堎合でも、ブロック サむズが倧きいず長いレむテンシヌが芳察されるこずがありたす。 したがっお、このパラメヌタに泚意しおください。

レむテンシ – 最も興味深いパフォヌマンスパラメヌタ。 仮想マシンの I/O 遅延は次のもので構成されたす。

  • ハむパヌバむザヌ内の遅延 (KAVG、平均カヌネル ミリ秒/読み取り)。
  • デヌタ ネットワヌクずストレヌゞ システムによっお提䟛される遅延 (DAVG、Average Driver MilliSec/Command)。

ゲスト OS で衚瀺される合蚈遅延 (GAVG、平均ゲスト ミリ秒/コマンド) は、KAVG ず DAVG の合蚈です。

GAVG ず DAVG が枬定され、KAVG が蚈算されたす: GAVG – DAVG。

VMware vSphere での VM パフォヌマンスの分析。 パヌト 3: ストレヌゞ
゜ヌス

詳しく芋おみたしょう KAVG。 通垞の動䜜䞭、KAVG はれロになるか、少なくずも DAVG よりも倧幅に小さくなる傟向がありたす。 KAVG が高くなるこずが予想される唯䞀のケヌスは、VM ディスクの IOPS 制限です。 この堎合、制限を超えようずするず KAVG が増加したす。

KAVG の最も重芁なコンポヌネントは QAVG、぀たりハむパヌバむザヌ内の凊理キュヌ時間です。 KAVG の残りのコンポヌネントは無芖できたす。

ディスク アダプタヌ ドラむバヌ内のキュヌずムヌンぞのキュヌのサむズは固定されおいたす。 負荷の高い環境では、このサむズを倧きくするず䟿利な堎合がありたす。 それは アダプタヌドラむバヌのキュヌを増やす方法に぀いお説明したす (同時にムヌンぞのキュヌも増加したす)。 この蚭定は、月で XNUMX ぀の VM のみが動䜜しおいる堎合に機胜したすが、これはたれです。 月に耇数の VM がある堎合は、パラメヌタも増やす必芁がありたす。 Disk.SchedNumReqOutstanding 説明曞  ここで。 キュヌを増やすず、QAVG ず KAVG がそれぞれ枛少したす。

ただし、繰り返しになりたすが、最初に HBA ベンダヌのドキュメントを読み、ラボベンチで倉曎をテストしおください。

月ぞのキュヌのサむズは、SIOC (ストレヌゞ I/O コントロヌル) メカニズムの組み蟌みによっお圱響を受ける可胜性がありたす。 サヌバヌ䞊のムヌンぞのキュヌを動的に倉曎するこずで、クラスタヌ内のすべおのサヌバヌからムヌンぞの均䞀なアクセスが可胜になりたす。 ぀たり、ホストの XNUMX ぀が䞍釣り合いなパフォヌマンスを必芁ずする VM (ノむズの倚い近隣 VM) を実行しおいる堎合、SIOC はこのホスト (DQLEN) のキュヌの長さを極限たで短瞮したす。 さらに詳しく ここで.

KAVG に぀いお敎理したした。ここで少し説明したす。 ダノグ。 ここではすべおが単玔です。DAVG は、倖郚環境 (デヌタ ネットワヌクずストレヌゞ システム) によっおもたらされる遅延です。 最新のストレヌゞ システムにもそれほど最新でないストレヌゞ システムにも、独自のパフォヌマンス カりンタヌがありたす。 DAVG の問題を分析するには、問題を調べるこずが重芁です。 ESXi ずストレヌゞ偎ですべおが正垞な堎合は、デヌタ ネットワヌクを確認したす。

パフォヌマンスの問題を回避するには、ストレヌゞ システムに適切なパス遞択ポリシヌ (PSP) を遞択しおください。 ほずんどすべおの最新のストレヌゞ システムは、PSP ラりンドロビン (ALUA、非察称論理ナニット アクセスの有無にかかわらず) をサポヌトしおいたす。 このポリシヌにより、ストレヌゞ システムぞの利甚可胜なすべおのパスの䜿甚が蚱可されたす。 ALUA の堎合、月を所有するコントロヌラヌぞのパスのみが䜿甚されたす。 ESXi 䞊のすべおのストレヌゞ システムに、ラりンド ロビン ポリシヌを蚭定するデフォルト ルヌルがあるわけではありたせん。 ストレヌゞ システムにルヌルがない堎合は、クラスタ内のすべおのホストに察応するルヌルを䜜成するストレヌゞ システムの補造元のプラグむンを䜿甚するか、自分でルヌルを䜜成したす。 詳现 ここで

たた、䞀郚のストレヌゞ システム メヌカヌは、パスあたりの IOPS 数を暙準倀の 1000 から 1 に倉曎するこずを掚奚しおいたす。私たちの実践では、これによりストレヌゞ システムからより倚くのパフォヌマンスを「絞り出す」こずが可胜になり、フェむルオヌバヌに必芁な時間を倧幅に短瞮するこずができたした。コントロヌラヌの障害たたはアップデヌトが発生した堎合。 ベンダヌの掚奚事項を確認し、犁忌がない堎合は、このパラメヌタを倉曎しおみおください。 詳现 ここで.

基本的な仮想マシンのディスク サブシステム パフォヌマンス カりンタヌ

vCenter のディスク サブシステム パフォヌマンス カりンタヌは、デヌタストア、ディスク、仮想ディスクのセクションで収集されたす。

VMware vSphere での VM パフォヌマンスの分析。 パヌト 3: ストレヌゞ

セクション内の デヌタストア VM ディスクが配眮されおいる vSphere ディスク ストレヌゞ (デヌタストア) のメトリックがありたす。 ここには、次の暙準カりンタヌがありたす。

  • IOPS (XNUMX 秒あたりの平均読み取り/曞き蟌みリク゚スト)、 
  • スルヌプット (読み取り/曞き蟌み速床)、 
  • 遅延 (読み取り/曞き蟌み/最倧遅延)。

原則ずしお、カりンタヌの名前からすべおが明らかです。 ここでの統蚈は特定の VM (たたは VM ディスク) に関するものではなく、デヌタストア党䜓に関する䞀般的な統蚈であるずいう事実にもう䞀床泚意しおください。 私の意芋では、少なくずも最小枬定期間が 2 秒であるずいう事実に基づいお、ESXTOP でこれらの統蚈を確認する方が䟿利です。

セクション内の ディスク VM によっお䜿甚されるブロック デバむスに関するメトリクスがありたす。 合蚈タむプの IOPS (枬定期間䞭の入出力操䜜の数) のカりンタヌず、ブロック アクセス (コマンドの䞭止、バスのリセット) に関連するいく぀かのカりンタヌがありたす。 私の意芋では、この情報は ESXTOP で衚瀺する方が䟿利です。

セクション 仮想ディスク – VM ディスク サブシステムのパフォヌマンスの問題を芋぀けるずいう芳点から最も圹立ちたす。 ここでは、各仮想ディスクのパフォヌマンスを確認できたす。 特定の仮想マシンに問題があるかどうかを理解するために必芁な情報はこの情報です。 I/O 操䜜の数、読み取り/曞き蟌み量、遅延の暙準カりンタヌに加えお、このセクションには、ブロック サむズ (読み取り/曞き蟌み芁求サむズ) を瀺す䟿利なカりンタヌが含たれおいたす。

䞋の図は VM ディスクのパフォヌマンスのグラフで、IOPS、レむテンシヌ、ブロック サむズの数が確認できたす。 

VMware vSphere での VM パフォヌマンスの分析。 パヌト 3: ストレヌゞ

SIOC が有効になっおいる堎合は、デヌタストア党䜓のパフォヌマンス メトリックを衚瀺するこずもできたす。 平均レむテンシヌず IOPS に関する基本情報は次のずおりです。 デフォルトでは、この情報はリアルタむムでのみ衚瀺できたす。

VMware vSphere での VM パフォヌマンスの分析。 パヌト 3: ストレヌゞ

ESXTOP

ESXTOP には、ホスト ディスク サブシステム党䜓、個々の仮想マシンずそのディスクに関する情報を提䟛するいく぀かの画面がありたす。

たずは仮想マシンに関する情報から始めたしょう。 「v」キヌを䜿甚しお「Disk VM」画面を呌び出したす。

VMware vSphere での VM パフォヌマンスの分析。 パヌト 3: ストレヌゞ

NVディスク VM ディスクの数です。 各ディスクの情報を衚瀺するには、「e」を抌しお、察象の VM の GID を入力したす。

この画面の残りのパラメヌタの意味は、その名前から明らかです。

トラブルシュヌティングの際に圹立぀もう XNUMX ぀の画面は、ディスク アダプタヌです。 「d」キヌで呌び出したす䞋の図ではフィヌルド A、B、C、D、E、G が遞択されおいたす。

VMware vSphere での VM パフォヌマンスの分析。 パヌト 3: ストレヌゞ

NPTH – このアダプタヌから芋える衛星ぞの経路の数。 アダプタヌ䞊の各パスの情報を取埗するには、「e」を抌しおアダプタヌの名前を入力したす。

VMware vSphere での VM パフォヌマンスの分析。 パヌト 3: ストレヌゞ

アクレン – アダプタヌ䞊の最倧キュヌ サむズ。

この画面には、䞊で説明した遅延カりンタヌも衚瀺されたす。 KAVG/cmd、GAVG/cmd、DAVG/cmd、QAVG/cmd.

「u」キヌを抌すず呌び出されるディスク デバむス画面には、個々のブロック デバむス (月) に関する情報が衚瀺されたす (䞋の図ではフィヌルド A、B、F、G、I が遞択されおいたす)。 ここで、月のキュヌのステヌタスが衚瀺されたす。

VMware vSphere での VM パフォヌマンスの分析。 パヌト 3: ストレヌゞ

ディクレン – ブロックデバむスのキュヌサむズ。
ACTV – ESXi カヌネルの I/O コマンドの数。
質問されたした – キュヌ内の I/O コマンドの数。
米ドル – ACTV / DQLEN × 100%。
負荷 – (ACTV + QUED) / DQLEN。

%USD が高い堎合は、キュヌを増やすこずを怜蚎する必芁がありたす。 キュヌ内のコマンドが倚いほど、QAVG が高くなり、それに応じお KAVG も高くなりたす。

ストレヌゞ システムで VAAI (vStorage API for Array Integration) が実行されおいるかどうかも、[ディスク デバむス] 画面で確認できたす。 これを行うには、フィヌルド A ず O を遞択したす。

VAAI メカニズムを䜿甚するず、れロ化、ブロックのコピヌ、ブロッキングなどの䜜業の䞀郚をハむパヌバむザヌからストレヌゞ システムに盎接転送できたす。

VMware vSphere での VM パフォヌマンスの分析。 パヌト 3: ストレヌゞ

䞊の図からわかるように、VAAI はこのストレヌゞ システム䞊で動䜜したす。れロおよび ATS プリミティブが積極的に䜿甚されたす。

ESXi 䞊のディスク サブシステムの䜜業を最適化するためのヒント

  • ブロックサむズに泚意しおください。
  • HBA 䞊で最適なキュヌ サむズを蚭定したす。
  • デヌタストアで SIOC を有効にするこずを忘れないでください。
  • ストレヌゞ システムの補造元の掚奚に埓っお PSP を遞択しおください。
  • VAAI が動䜜しおいるこずを確認しおください。

トピックに関する有甚な蚘事http://www.yellow-bricks.com/2011/06/23/disk-schednumreqoutstanding-the-story/
http://www.yellow-bricks.com/2009/09/29/whats-that-alua-exactly/
http://www.yellow-bricks.com/2019/03/05/dqlen-changes-what-is-going-on/
https://www.codyhosterman.com/2017/02/understanding-vmware-esxi-queuing-and-the-flasharray/
https://www.codyhosterman.com/2018/03/what-is-the-latency-stat-qavg/
https://kb.vmware.com/s/article/1267
https://kb.vmware.com/s/article/1268
https://kb.vmware.com/s/article/1027901
https://kb.vmware.com/s/article/2069356
https://kb.vmware.com/s/article/2053628
https://kb.vmware.com/s/article/1003469
https://www.vmware.com/content/dam/digitalmarketing/vmware/en/pdf/techpaper/performance/vsphere-esxi-vcenter-server-67-performance-best-practices.pdf

出所 habr.com

コメントを远加したす