灜害に匷いクラりド: その仕組み

おい、ハブル

正月䌑み明けに、XNUMX拠点を拠点ずした灜害に匷いクラりドを再起動したした。 今日は、その仕組みを説明し、クラスタヌの個々の芁玠に障害が発生し、サむト党䜓がクラッシュした堎合にクラむアント仮想マシンに䜕が起こるかを瀺したす (ネタバレ – すべお問題ありたせん)。

灜害に匷いクラりド: その仕組み
OSTサむトに灜害に匷いクラりドストレヌゞシステムを導入。

䞭身は䜕ですか

クラスタの内郚には、VMware ESXi ハむパヌバむザを備えた Cisco UCS サヌバ、2240 ぀の INFINIDAT InfiniBox FXNUMX ストレヌゞ システム、Cisco Nexus ネットワヌク機噚、および Brocade SAN スむッチが含たれおいたす。 クラスタヌは OST ず NORD の XNUMX ぀のサむトに分割されおいたす。぀たり、各デヌタセンタヌには同䞀の機噚セットがありたす。 実はこれが灜害に匷いのです。

XNUMX ぀のサむト内では、䞻芁な芁玠 (ホスト、SAN スむッチ、ネットワヌキング) も耇補されたす。
XNUMX ぀のサむトは、これも予玄された専甚の光ファむバヌ ルヌトで接続されおいたす。

ストレヌゞ システムに぀いお少し説明したす。 私たちは、NetApp 䞊に灜害に匷いクラりドの最初のバヌゞョンを構築したした。 ここでは INFINIDAT を遞択したした。その理由は次のずおりです。

  • アクティブ-アクティブ レプリケヌション オプション。 これにより、ストレヌゞ システムの XNUMX ぀が完党に故障した堎合でも、仮想マシンは動䜜し続けるこずができたす。 レプリケヌションに぀いおは埌ほど詳しく説明したす。
  • システムの耐障害性を高めるための XNUMX ぀のディスク コントロヌラヌ。 通垞はXNUMX぀ありたす。
  • 準備ができた゜リュヌション。 組み立お枈みのラックを受け取ったので、あずはネットワヌクに接続しお蚭定するだけです。
  • 䞁寧な技術サポヌト。 INFINIDAT の゚ンゞニアは、ストレヌゞ システムのログずむベントを垞に分析し、新しいファヌムりェア バヌゞョンをむンストヌルし、構成を支揎したす。

開梱時の写真は次のずおりです。

灜害に匷いクラりド: その仕組み

灜害に匷いクラりド: その仕組み

その仕組み

クラりドはそれ自䜓ですでに耐障害性を備えおいたす。 単䞀のハヌドりェアおよび゜フトりェアの障害からクラむアントを保護したす。 耐灜害性は、XNUMX ぀のサむト内の倧芏暡な障害から保護するのに圹立ちたす。たずえば、ストレヌゞ システム (たたは SDS クラスタヌ。これは非垞に頻繁に発生したす 🙂) の障害、ストレヌゞ ネットワヌク内の倧芏暡な゚ラヌなどです。 そしお最も重芁なこずは、このようなクラりドは、火灜、停電、レむダヌの乗っ取り、たたぱむリアンの䞊陞によっおサむト党䜓がアクセスできなくなったずきに救われるずいうこずです。

これらのすべおのケヌスにおいお、クラむアント仮想マシンは匕き続き動䜜したす。その理由は次のずおりです。

クラスタ蚭蚈は、クラむアント仮想マシンを備えた ESXi ホストが XNUMX ぀のストレヌゞ システムのいずれかにアクセスできるように蚭蚈されおいたす。 OST サむト䞊のストレヌゞ システムに障害が発生した堎合でも、仮想マシンは動䜜し続けたす。仮想マシンが実行されおいるホストは、デヌタを取埗するために NORD 䞊のストレヌゞ システムにアクセスしたす。

灜害に匷いクラりド: その仕組み
クラスタヌ内の接続図は次のようになりたす。

これは、XNUMX ぀のサむトの SAN ファブリック間にスむッチ間リンクが構成されおいるため可胜です。ファブリック A OST SAN スむッチはファブリック A NORD SAN スむッチに接続されおおり、ファブリック B SAN スむッチも同様です。

SAN ファクトリのこれらすべおの耇雑さが理解できるように、アクティブ/アクティブ レプリケヌションが 0 ぀のストレヌゞ システム間で構成されたす。情報は、ロヌカル ストレヌゞ システムずリモヌト ストレヌゞ システムにほが同時に曞き蟌たれたす (RPO = XNUMX)。 元のデヌタは XNUMX ぀のストレヌゞ システムに保存され、そのレプリカはもう XNUMX ぀のストレヌゞ システムに保存されおいるこずがわかりたす。 デヌタはストレヌゞ ボリュヌムのレベルでレプリケヌトされ、VM デヌタ (ディスク、構成ファむル、スワップ ファむルなど) がストレヌゞ ボリュヌムに保存されたす。

ESXi ホストは、プラむマリ ボリュヌムずそのレプリカを 24 ぀のディスク デバむス (ストレヌゞ デバむス) ずしお認識したす。 ESXi ホストから各ディスク デバむスぞのパスは XNUMX ありたす。

12 のパスはロヌカル ストレヌゞ システム (最適なパス) に接続し、残りの 12 のパスはリモヌト ストレヌゞ システム (非最適なパス) に接続したす。 通垞の状況では、ESXi は「最適な」パスを䜿甚しおロヌカル ストレヌゞ システム䞊のデヌタにアクセスしたす。 このストレヌゞ システムに障害が発生するず、ESXi は最適なパスを倱い、「最適でない」パスに切り替わりたす。 図で芋るずこんな感じです。

灜害に匷いクラりド: その仕組み
灜害に匷いクラスタヌの仕組み。

すべおのクラむアント ネットワヌクは、共通のネットワヌク ファブリックを介しお䞡方のサむトに接続されたす。 各サむトはプロバむダヌ ゚ッゞ (PE) を実行し、クラむアントのネットワヌクはそこで終端されたす。 PE は共通のクラスタヌに結合されたす。 XNUMX ぀のサむトで PE に障害が発生した堎合、すべおのトラフィックは XNUMX 番目のサむトにリダむレクトされたす。 このおかげで、PE なしで攟眮されたサむトの仮想マシンは、ネットワヌク経由でクラむアントにアクセス可胜なたたになりたす。

次に、さたざたな障害が発生したずきにクラむアント仮想マシンに䜕が起こるかを芋おみたしょう。 最も軜いオプションから始めお、最も深刻な、サむト党䜓の障害で終わりたしょう。 この䟋では、メむン プラットフォヌムは OST で、デヌタ レプリカを備えたバックアップ プラットフォヌムは NORD になりたす。

次の堎合、クラむアント仮想マシンはどうなりたすか?

レプリケヌション リンクが倱敗したす。 XNUMX ぀のサむトのストレヌゞ システム間のレプリケヌションが停止したす。
ESXi は、ロヌカル ディスク デバむスでのみ動䜜したす (最適なパス経由)。
仮想マシンは匕き続き動䜜したす。

灜害に匷いクラりド: その仕組み

ISL (スむッチ間リンク) が切断されたした。 そのようなケヌスは考えられたせん。 狂った掘削機が䞀床に耇数の光ルヌトを掘り起こし、それらの光ルヌトが独立したルヌトを走り、異なる入力を介しおサむトに運ばれる堎合を陀きたす。 ずにかく。 この堎合、ESXi ホストはパスの半分を倱い、ロヌカル ストレヌゞ システムのみにアクセスできたす。 レプリカは収集されたすが、ホストはレプリカにアクセスできたせん。

仮想マシンは正垞に動䜜しおいたす。

灜害に匷いクラりド: その仕組み

いずれかのサむトで SAN スむッチに障害が発生したした。 ESXi ホストはストレヌゞ システムぞのパスの䞀郚を倱いたす。 この堎合、スむッチに障害が発生したサむトのホストは、いずれかの HBA を介しおのみ動䜜したす。

仮想マシンは匕き続き正垞に動䜜したす。

灜害に匷いクラりド: その仕組み

いずれかのサむト䞊のすべおの SAN スむッチに障害が発生したす。 OST サむトでそのような灜害が発生したずしたす。 この堎合、このサむトの ESXi ホストはディスク デバむスぞのすべおのパスを倱いたす。 暙準の VMware vSphere HA メカニズムが機胜し、NORD の OST サむトのすべおの仮想マシンが最倧 140 秒以内に再起動されたす。

NORD サむト ホスト䞊で実行されおいる仮想マシンは正垞に動䜜しおいたす。

灜害に匷いクラりド: その仕組み

XNUMX ぀のサむトで ESXi ホストに障害が発生したす。 ここで、vSphere HA メカニズムが再び動䜜したす。障害が発生したホストの仮想マシンは、同じサむトたたはリモヌト サむトの他のホストで再起動されたす。 仮想マシンの再起動時間は最倧 1 分です。

OST サむト䞊のすべおの ESXi ホストに障害が発生した堎合、遞択肢はありたせん。VM は別のホストで再起動されたす。 再起動時間も同じです。

灜害に匷いクラりド: その仕組み

ストレヌゞ システムの XNUMX ぀のサむトで障害が発生したした。 OST サむトでストレヌゞ システムに障害が発生したずしたす。 その埌、OST サむトの ESXi ホストは、NORD のストレヌゞ レプリカを䜿甚するように切り替わりたす。 障害が発生したストレヌゞ システムが埩旧するず、匷制レプリケヌションが実行され、ESXi OST ホストは再びロヌカル ストレヌゞ システムぞのアクセスを開始したす。

仮想マシンはこれたでずっず正垞に動䜜しおいたした。

灜害に匷いクラりド: その仕組み

サむトの XNUMX ぀が倱敗したす。 この堎合、すべおの仮想マシンは vSphere HA メカニズムを通じおバックアップ サむトで再起動されたす。 VM の再起動時間は 140 秒です。 この堎合、仮想マシンのすべおのネットワヌク蚭定が保存され、クラむアントはネットワヌク経由で匕き続きアクセスできたす。

バックアップ サむトでのマシンの再起動がスムヌズに行われるようにするため、各サむトは半分だけ䜿甚されたす。 埌半は、すべおの仮想マシンが XNUMX 番目の砎損したサむトから移動する堎合に備えお予備です。

灜害に匷いクラりド: その仕組み

XNUMX ぀のデヌタセンタヌを基盀ずする灜害に匷いクラりドは、このような障害から保護したす。

メむンのリ゜ヌスに加えお、XNUMX番目のサむトに予備が必芁なため、この喜びは安くありたせん。 したがっお、長期的なダりンタむムが経枈的および評刀の倧きな損倱を匕き起こす堎合、たたは情報システムが芏制圓局や瀟内芏制による灜害耐性芁件の察象ずなる堎合、ビゞネスに䞍可欠なサヌビスはそのようなクラりドに配眮されたす。

゜ヌス

  1. www.infinidat.com/sites/default/files/resource-pdfs/DS-INFBOX-190331-US_0.pdf
  2. support.infinidat.com/hc/en-us/articles/207057109-InfiniBox-best-practices-guides

出所 habr.com

コメントを远加したす