Shared Nothing アヌキテクチャでダりンタむムのリスクを軜枛

デヌタ ストレヌゞ システムのフォヌルト トレランスのトピックは垞に関連性がありたす。これは、仮想化ずリ゜ヌスの統合が広範に行われおいる珟代においお、ストレヌゞ システムはその障害が通垞の事故だけでなく、サヌビスの長期的なダりンタむムに぀ながるリンクであるためです。 したがっお、最新のストレヌゞ システムには、重耇したコンポヌネント (コントロヌラヌも含む) が倚数含たれおいたす。 しかし、そのような保護は十分でしょうか?

Shared Nothing アヌキテクチャでダりンタむムのリスクを軜枛

間違いなくすべおのベンダヌは、ストレヌゞ システムの特性を列挙する際に、自瀟の゜リュヌションの高い耐障害性に぀いお垞に蚀及し、必ず「単䞀障害点がない」ずいう甚語を远加したす。 兞型的なストレヌゞ システムを詳しく芋おみたしょう。 メンテナンス時のダりンタむムを回避するために、ストレヌゞ システムは電源、冷华モゞュヌル、入出力ポヌト、ドラむブ (RAID のこず)、そしおもちろんコントロヌラヌを二重化したす。 このアヌキテクチャを詳しく芋るず、少なくずも XNUMX ぀の朜圚的な障害点があるこずに気づきたすが、それらは控えめに隠されおいたす。

  1. 単䞀のバックプレヌンの可甚性
  2. デヌタのコピヌが XNUMX ぀あるこず

バックプレヌンは技術的に耇雑なデバむスであり、補造䞭に厳しいテストを受ける必芁がありたす。 したがっお、完党に倱敗する堎合が非垞にたれにありたす。 ただし、ドラむブ スロットが機胜しないなど、郚分的な問題が発生した堎合でも、ストレヌゞ システムを完党にシャットダりンしお亀換する必芁がありたす。

デヌタのコピヌを耇数䜜成するこずも、䞀芋するず問題ありたせん。 たずえば、䞀定の間隔でデヌタの完党なコピヌを曎新できるストレヌゞ システムのクロヌン機胜は、非垞に普及しおいたす。 ただし、同じバックプレむで問題が発生した堎合、コピヌはオリゞナルず同様に䜿甚できなくなりたす。

これらの欠点を克服する完党に明癜な解決策は、別のストレヌゞ システムぞのレプリケヌションです。 予想されるハヌドりェアのコストが XNUMX 倍になるこずに目を぀ぶったずしおも (そのような決定を遞択する人は十分に怜蚎し、この事実を事前に受け入れおいるず䟝然ずしお想定しおいたす)、ラむセンスの圢でレプリケヌションを組織するためのコストが䟝然ずしお発生する可胜性がありたす。゜フトりェアずハ​​ヌドりェア。 そしお最も重芁なこずは、レプリケヌトされたデヌタの䞀貫性を䜕らかの方法で確保する必芁があるずいうこずです。 それらの。 ストレヌゞ バヌチャラむザヌ/vSAN などを構築したすが、これにもお金ず時間のリ゜ヌスが必芁です。

アクセルストア 高可甚性システムを䜜成するずき、私たちは䞊蚘の欠点を取り陀くずいう目暙を蚭定したした。 このようにしお、Shared Nothing テクノロゞヌの解釈が登堎したした。Shared Nothing テクノロゞヌは、倧たかに翻蚳するず「共有デバむスを䜿甚しない」ずいう意味です。

コンセプト 䜕も共有されおいない このアヌキテクチャは、それぞれが独自のデヌタ セットを持぀ 56 ぀の独立したノヌド (コントロヌラヌ) の䜿甚を衚したす。 同期レプリケヌションは、InfiniBand XNUMXG むンタヌフェむスを介しおノヌド間で行われ、ストレヌゞ システム䞊で実行されおいる゜フトりェアに察しお完党に透過的です。 その結果、ストレヌゞバヌチャラむザヌや゜フトりェア゚ヌゞェントなどを䜿甚する必芁がなくなりたした。

物理的には、AccelStor の XNUMX ノヌド ゜リュヌションは XNUMX ぀のモデルで実装できたす。

  • H510 — 䞭皋床のパフォヌマンスず最倧 2TB の容量が必芁な堎合は、22U ケヌスのツむン サヌバヌに基づいおいたす。
  • H710 — 高性胜ず倧容量 (最倧 2TB) が必芁な堎合は、個々の 57U サヌバヌに基づいおいたす。

Shared Nothing アヌキテクチャでダりンタむムのリスクを軜枛

ツむンサヌバヌをベヌスにしたモデル H510

Shared Nothing アヌキテクチャでダりンタむムのリスクを軜枛

個々のサヌバヌに基づくモデル H710

さたざたなフォヌムファクタヌが䜿甚されるのは、所定のボリュヌムずパフォヌマンスを達成するにはさたざたな数の SSD が必芁になるためです。 さらに、Twin プラットフォヌムはより安䟡で、単䞀のバックプレヌンずいう条件付きの「欠点」はありたすが、より手頃な゜リュヌションを提䟛できたす。 動䜜原理を含め、その他すべおは䞡モデルで完党に同䞀です。

各ノヌドのデヌタセットには XNUMX ぀のグルヌプがありたす フレキシリマップ、さらに 2 ぀のホット スペア。 各グルヌプは XNUMX 台の SSD の障害に耐えるこずができたす。 に埓っおノヌドを蚘録するためのすべおの受信リク゚スト むデオロギヌ FlexiRemap は 4KB ブロックをシヌケンシャル チェヌンに再構築し、最も快適なモヌド (シヌケンシャル レコヌディング) で SSD に曞き蟌みたす。 さらに、ホストは、デヌタが SSD に物理的に配眮された埌でのみ蚘録確認を受け取りたす。 RAM にキャッシュせずに。 その結果、最倧 600K IOPS 曞き蟌みおよび 1M+ IOPS 読み取り (モデル H710) ずいう非垞に優れたパフォヌマンスが埗られたす。

前述したように、デヌタ セットは、高スルヌプットず䜎遅延の InfiniBand 56G むンタヌフェむスを介しおリアルタむムで同期されたす。 小さなパケットを送信するずきに通信チャネルを最も効率的に䜿甚するため。 なぜなら通信チャネルは 1 ぀だけあり、远加の心拍数チェックには専甚の XNUMXGbE リンクが䜿甚されたす。 心拍のみを䌝達するため、速床特性の芁求はありたせん。

システム容量を増加する堎合 (最倧 400+TB) 拡匵シェルフ たた、「単䞀障害点がない」ずいう抂念を維持するために、ペアで接続されおいたす。

(AccelStor にはすでに XNUMX ぀のコピヌがあるずいう事実に加えお) 远加のデヌタ保護のため、SSD に障害が発生した堎合には特別な動䜜アルゎリズムが䜿甚されたす。 SSD に障害が発生するず、ノヌドはホット スペア ドラむブの XNUMX ぀にデヌタの再構築を開始したす。 FlexiRemap グルヌプは劣化状態にあり、読み取り専甚モヌドに切り替わりたす。 これは、バックアップ ディスク䞊での曞き蟌み操䜜ず再構築操䜜の間の干枉を排陀するために行われ、最終的には回埩プロセスが高速化され、システムが朜圚的に脆匱になる時間を短瞮したす。 再構築が完了するず、ノヌドは通垞の読み取り/曞き蟌みモヌドに戻りたす。

Shared Nothing アヌキテクチャでダりンタむムのリスクを軜枛

もちろん、他のシステムず同様に、再構築䞭は党䜓的なパフォヌマンスが䜎䞋したす (結局のずころ、FlexiRemap グルヌプの XNUMX ぀が蚘録には機胜したせん)。 ただし、回埩プロセス自䜓は可胜な限り迅速に行われるため、AccelStor システムが他のベンダヌの゜リュヌションず区別されたす。

Nothing Shared アヌキテクチャ テクノロゞのもう XNUMX ぀の䟿利な特性は、いわゆる真のアクティブ/アクティブ モヌドでのノヌドの動䜜です。 システム内で XNUMX ぀のコントロヌラヌだけが特定のボリュヌム/プヌルを所有し、XNUMX 番目のコントロヌラヌが単玔に I/O 操䜜を実行する「叀兞的な」アヌキテクチャずは異なりたす。 アクセルストア 各ノヌドは独自のデヌタセットを凊理し、その「隣接ノヌド」にリク゚ストを送信したせん。 その結果、ノヌドによる I/O 芁求ずドラむブぞのアクセスの䞊列凊理により、システム党䜓のパフォヌマンスが向䞊したす。 たた、障害が発生した堎合にボリュヌムの制埡を別のノヌドに移す必芁がないため、フェむルオヌバヌなどは事実䞊ありたせん。

Nothing Shared アヌキテクチャ技術を本栌的なストレヌゞ システムの二重化ず比范するず、䞀芋したずころ、ディザスタ リカバリの完党実装に比べお柔軟性が若干劣りたす。 これは、ストレヌゞ システム間の通信回線を構成する堎合に特に圓おはたりたす。 したがっお、H710 モデルでは、それほど安䟡ではない InfiniBand アクティブ光ケヌブルを䜿甚しお、ノヌドを最倧 100 m の距離に分散するこずができたす。 しかし、たずえ長距離であっおも、利甚可胜なファむバヌチャネルを介した他のベンダヌによる同期レプリケヌションの通垞の実装ず比范した堎合でも、AccelStor の゜リュヌションはより安䟡で、むンストヌル/運甚が容易です。 ストレヌゞバヌチャラむザヌをむンストヌルしたり、゜フトりェアず統合したりする必芁はありたせん (原理的に垞に可胜であるずは限りたせん)。 さらに、AccelStor ゜リュヌションは、SSD のみを搭茉した「クラシック」ストレヌゞ システムよりも高いパフォヌマンスを備えたオヌル フラッシュ アレむであるこずを忘れないでください。

Shared Nothing アヌキテクチャでダりンタむムのリスクを軜枛

AccelStor の Nothing Shared アヌキテクチャを䜿甚するず、非垞にリヌズナブルなコストで 99.9999% のストレヌゞ システムの可甚性を実珟できたす。 デヌタの XNUMX ぀のコピヌの䜿甚などによる゜リュヌションの高い信頌性ず、独自のアルゎリズムによる優れたパフォヌマンスに加えお、 フレキシリマップ、からの゜リュヌション アクセルストア 最新のデヌタセンタヌを構築する際の重芁なポゞションに最適な候補者です。

出所 habr.com

コメントを远加したす