Huawei Dorado V6: 四川省の暑さ

Huawei Dorado V6: 四川省の暑さ
今幎のモスクワの倏は、正盎蚀っおあたり良くなかった。 始たりが早すぎお、誰もがそれに反応する時間がなく、すでに34月末には終わっおいたした。 そのため、ファヌりェむが私を䞭囜のRnDセンタヌのある成郜に招埅したずき、日陰で+6床の倩気予報を芋お、すぐに同意したした。 結局のずころ、私はもう同じ幎霢ではないので、少し骚を枩める必芁がありたす。 ただし、成郜が実際に䜍眮する四川省は蟛い食べ物が倧奜きなこずで有名なので、骚だけでなく内臓も枩めるこずができたこずに泚意したいず思いたす。 しかし、それでも、これは旅行に関するブログではないので、旅行の䞻な目的である新しいストレヌゞ システムである Huawei Dorado VXNUMX に戻りたしょう。 この蚘事は、あなたを過去から少し揺さぶりたす。なぜなら... 公匏発衚前に曞かれたものですが、リリヌス埌にのみ公開されたした。 そこで、今日はファヌりェむが私たちのために甚意しおくれた興味深くおおいしいものすべおを詳しく芋おいきたす。

Huawei Dorado V6: 四川省の暑さ
新ラむンには5モデルがラむンナップされる。 3000V6 を陀くすべおのモデルには、SAS ず NVMe の 2.5 ぀のバヌゞョンがありたす。 この遞択により、このシステムで䜿甚できるディスクのむンタヌフェむス、バック゚ンド ポヌト、およびシステムにむンストヌルできるディスク ドラむブの数が決たりたす。 NVMe には、埓来の 36 むンチ SAS SSD よりも薄く、最倧 XNUMX 個たで搭茉できるパヌムサむズの SSD が䜿甚されたす。 新しいラむンはオヌル フラッシュであり、ディスクを䜿甚した構成はありたせん。

Huawei Dorado V6: 四川省の暑さ
パヌムNVMe SSD

私の意芋では、Dorado 8000 ず 18000 が最も興味深いモデルのように芋えたすが、ファヌりェむはこれらをハむ゚ンド システムずしお䜍眮づけおおり、ファヌりェむの䟡栌蚭定方針のおかげで、これらのミッドレンゞ モデルを競合セグメントず察比させおいたす。 今日のレビュヌで焊点を圓おるのはこれらのモデルです。 蚭蚈䞊の特城により、ゞュニア デュアル コントロヌラヌ システムは、Dorado 8000 や 18000 ずは若干異なるアヌキテクチャを備えおいるため、今日説明するすべおがゞュニア モデルに圓おはたるわけではないこずにすぐに泚意しおください。

新しいシステムの䞻な特城の XNUMX ぀は、瀟内で開発された耇数のチップの䜿甚であり、それぞれのチップにより、コントロヌラヌの䞭倮プロセッサからの論理負荷を分散し、さたざたなコンポヌネントに機胜を远加できたす。
Huawei Dorado V6: 四川省の暑さ

新しいシステムの䞭心ずなるのは、ARMテクノロゞヌに基づいお開発され、ファヌりェむが独自に補造したKunpeng 920プロセッサです。 モデルに応じお、各コントロヌラヌに搭茉されおいるコアの数、呚波数、プロセッサの数が異なりたす。
Huawei Dorado V6 8000 – 2CPU、64 コア
Huawei Dorado V6 18000 – 4CPU、48 コア
Huawei Dorado V6: 四川省の暑さ

ファヌりェむはこのプロセッサをARMアヌキテクチャに基づいお開発しおおり、私の知る限り、圓初は䞀郚のV8000モデルで既にそうであったように、叀いDorado 18000および5モデルにのみこのプロセッサを搭茉する予定でしたが、制裁によりこの考えは調敎されたした。 もちろん、ARMは制裁発動䞭にファヌりェむぞの協力を拒吊するこずに぀いおも話しおいたが、ここでの状況はむンテルの堎合ずは異なる。 ファヌりェむはこれらのチップを独自に補造しおおり、いかなる制裁もこのプロセスを止めるこずはできたせん。 ARMずの関係を断぀こずは、新たな開発ぞのアクセスを倱う恐れがあるだけです。 性胜に関しおは、独自のテストを実斜した埌にのみ刀断可胜ずなりたす。 Dorado 18000 システムから 1M IOPS が問題なく陀去される様子を芋おきたしたが、ラック内で自分の手で再珟するたでは信じられたせん。 しかし、コントロヌラヌには本圓に倧きな力がありたす。 叀いモデルには 4 ぀のコントロヌラヌが搭茉されおおり、それぞれに 4 ぀のプロセッサヌが搭茉されおおり、合蚈 768 コアになりたす。
Huawei Dorado V6: 四川省の暑さ

ただし、コアに぀いおは埌ほど、新しいシステムのアヌキテクチャを怜蚎するずきに説明したすが、ここではシステムにむンストヌルされおいる別のチップに戻りたしょう。 このチップは非垞に興味深い゜リュヌションのように芋えたす アセンド310 私が理解しおいる限り、最近䞀般公開された Ascend 910 の匟です。 そのタスクは、システムに入るデヌタ ブロックを分析しお読み取りヒット率を高めるこずです。 仕事でどのように機胜するかを蚀うのは難しいです。 珟圚では、特定のテンプレヌトに埓っおのみ動䜜し、むンテリゞェント モヌドで孊習する機胜はありたせん。 むンテリゞェント モヌドの登堎は、おそらく来幎初めの将来のファヌムりェアで玄束されおいたす。

建築の話に移りたしょう。 ファヌりェむは、コンポヌネントを接続するためのフルメッシュアプ​​ロヌチを実装する独自のスマヌトマトリックステクノロゞヌの開発を続けおきたした。 ただし、V5 ではこれがコントロヌラヌからディスクぞのアクセスのみであった堎合、珟圚ではすべおのコントロヌラヌがバック゚ンドずフロント゚ンドの䞡方のすべおのポヌトにアクセスできるようになりたす。
Huawei Dorado V6: 四川省の暑さ

新しいマむクロサヌビス アヌキテクチャのおかげで、LUN が 4 ぀しかない堎合でも、すべおのコントロヌラヌ間の負荷分散も可胜になりたす。 このアレむ シリヌズの OS は、単にフラッシュ ドラむブの䜿甚のために最適化されたものではなく、れロから開発されたした。 すべおのコントロヌラが同じポヌトにアクセスできるため、コントロヌラの障害たたは再起動が発生した堎合でも、ホストはストレヌゞ システムぞの単䞀のパスを倱うこずはなく、パスの切り替えはストレヌゞ システム レベルで実行されたす。 ただし、ホスト䞊で UltraPath を䜿甚するこずは必ずしも必芁ではありたせん。 システムの蚭眮時のもう 8 ぀の「節玄」は、必芁なリンクの数が少なくなるこずです。 たた、2 ぀のコントロヌラヌに察する「叀兞的な」アプロヌチでは、2 ぀の工堎から XNUMX ぀のリンクが必芁になる堎合、Huawei の堎合は XNUMX ぀でも十分です (XNUMX ぀のリンクのスルヌプットの十分性に぀いおはここでは話しおいたせん)。
Huawei Dorado V6: 四川省の暑さ

前のバヌゞョンず同様に、ミラヌリングを備えたグロヌバル キャッシュが䜿甚されたす。 これにより、可甚性に圱響を䞎えるこずなく、最倧 3 ぀のコントロヌラを同時に倱うか、たたは XNUMX ぀のコントロヌラを連続しお倱うこずができたす。 ただし、デモスタンドで XNUMX ぀の障害が発生した堎合、残りの XNUMX ぀のコントロヌラヌ間の完党な負荷分散が確認されなかったこずは泚目に倀したす。 障害が発生したコントロヌラヌの負荷は、残りのコントロヌラヌの XNUMX ぀によっお完党に匕き継がれたした。 このため、この構成ではシステムをより長く動䜜させる必芁がある可胜性がありたす。 いずれにせよ、私自身のテストを䜿甚しおこれをさらに詳しく確認したす。
ファヌりェむは新しいシステムを゚ンドツヌ゚ンドのNVMeシステムず䜍眮付けおいたすが、珟時点ではNVMeOFはフロント゚ンドではただサポヌトされおおらず、FC、iSCSI、たたはNFSのみがサポヌトされおいたす。 他の機胜ず同様に、この機胜の終了時たたは次の機胜の開始時に、RoCE のサポヌトが玄束されたす。
Huawei Dorado V6: 四川省の暑さ

シェルフは RoCE を䜿甚しおコントロヌラにも接続されたすが、これに関連する欠点が XNUMX ぀ありたす。それは、SAS の堎合のように、シェルフの「ルヌプバック」接続が存圚しないこずです。 私の意芋では、かなり倧芏暡なシステムを蚈画しおいる堎合、これは䟝然ずしおかなり倧きな欠点です。 実際のずころ、すべおのシェルフは盎列に接続されおおり、そのうちの XNUMX ぀のシェルフに障害が発生するず、その埌に続く他のすべおのシェルフに完党にアクセスできなくなりたす。 この堎合、フォヌルト トレランスを確保するには、すべおのシェルフをコントロヌラヌに接続する必芁があり、システム内で必芁なバック゚ンド ポヌトの数が増加したす。

そしおもう XNUMX ぀蚀及する䟡倀があるのは、無停止曎新 (NDU) です。 䞊で述べたように、ファヌりェむは新しい Dorado ラむンの OS を操䜜するためのコンテナ アプロヌチを実装したした。これにより、コントロヌラを完党に再起動するこずなく、サヌビスを曎新しお再起動するこずができたす。 䞀郚の曎新にはカヌネル曎新が含たれるこずをすぐに蚀及する䟡倀がありたす。この堎合、曎新䞭にコントロヌラヌの埓来の再起動が必芁になる堎合がありたすが、垞に必芁であるわけではありたせん。 これにより、この操䜜が本皌働システムに䞎える圱響が軜枛されたす。

圓瀟の兵噚庫では、アレむの倧郚分が NetApp 補です。 したがっお、私がかなり頻繁に䜜業しなければならないシステムず少し比范しおみるず、非垞に論理的になるず思いたす。 これは、誰が優れおいお誰が劣っおいるのか、たたはどちらのアヌキテクチャが有利であるかを刀断するものではありたせん。 私は、同じ問題を解決するための異なるベンダヌによる XNUMX ぀の異なるアプロヌチを、熱狂的にならずに冷静に比范しおみたす。 はい、もちろん、この堎合、Huawei システムを「理論」で怜蚎したす。たた、将来のファヌムりェア バヌゞョンで実装される予定の点に぀いおも別途蚘茉したす。 珟時点で私が感じおいる利点は次のずおりです。

  1. サポヌトされおいる NVMe ドラむブの数。 NetApp には珟圚 288 個があり、Huawei にはモデルに応じお 1600  6400 個ありたす。 同時に、ファヌりェむの最倧䜿甚可胜容量は、NetApp システムず同様に 32PBe です (より正確には、31.64PBe)。 これは、同じボリュヌムのドラむブ (最倧 15Tb) がサポヌトされおいるにもかかわらずです。 ファヌりェむはこの事実を次のように説明しおいる圌らにはより倧きなスタンドを組み立おる機䌚がなかった。 理論䞊、量の制限はありたせんが、この事実をただテストできおいないだけです。 ただし、ここで泚目すべき点は、今日のフラッシュ ドラむブの機胜が非垞に高く、NVMe システムの堎合、トップ゚ンドの 24 コントロヌラ システムを利甚するには 2 台のドラむブで十分であるずいう事実に盎面しおいたす。 したがっお、システム内のディスクの数をさらに増やすず、パフォヌマンスが向䞊しないだけでなく、IOPS/Tb 比にも悪圱響を及がしたす。 もちろん、4 コントロヌラヌ システム 8000 および 16000 がどれだけのドラむブを凊理できるかを芋る䟡倀はありたす。 Kunpeng 920 の機胜ず可胜性はただ完党には明らかではありたせん。
  2. NetApp システムの所有者ずしおの Lun の存圚。 それらの。 月で操䜜を実行できるのは XNUMX ぀のコントロヌラヌだけであり、XNUMX ぀目のコントロヌラヌはそれ自䜓を介しお IO を枡すだけです。 それずは察照的に、Huawei システムには所有者がなく、デヌタ ブロックの操䜜 (圧瞮、重耇排陀) はどのコントロヌラヌでも実行でき、ディスクに曞き蟌むこずもできたす。
  3. コントロヌラの 5 ぀に障害が発生しおも、ポヌトはドロップされたせん。 䞀郚の人にずっお、この瞬間は非垞に危機的であるように芋えたす。 肝心なのは、ストレヌゞ システム内の切り替えはホスト偎よりも高速に行われる必芁があるずいうこずです。 同じ NetApp の堎合、実際にコントロヌラヌを匕き出しおパスを切り替えるずきに玄 XNUMX 秒のフリヌズが発生した堎合、Huawei に切り替えおもただ緎習する必芁がありたす。
  4. アップデヌト時にコントロヌラヌを再起動する必芁はありたせん。 NetApps の新しいバヌゞョンずファヌムりェア ブランチがかなり頻繁にリリヌスされるため、このこずが特に心配になり始めたした。 はい、Huawei の䞀郚のアップデヌトでは再起動が必芁になりたすが、すべおではありたせん。
  5. NetApp コントロヌラ 4 個の䟡栌で Huawei コントロヌラ XNUMX 個を賌入できたす。 䞊で述べたように、ファヌりェむの䟡栌政策のおかげで、ファヌりェむはハむ゚ンドモデルでミッドレンゞず競合できたす。
  6. シェルフ コントロヌラおよびポヌト カヌドには、システム効率の向䞊を目的ずした远加チップが存圚したす。

䞀般的な短所ず懞念事項:

  1. シェルフをコントロヌラヌに盎接接続するか、すべおのシェルフをコントロヌラヌに接続するために倚数のバック゚ンド ポヌトが必芁になりたす。
  2. ARM アヌキテクチャず倚数のチップの存圚 - どれだけ効率的に動䜜するのか、たたパフォヌマンスは十分なのか?

ほずんどの懞念や恐れは、新しいラむンを個人的にテストするこずで払拭できたす。 リリヌス埌すぐにモスクワに登堎し、自分のテスト甚にすぐに入手できるほどの数が揃うこずを願っおいたす。 これたでのずころ、䞀般的に同瀟のアプロヌチは興味深いものであり、新しいラむンは競合他瀟ず比范しお非垞に優れおいるず蚀えたす。 最終的な実装では倚くの疑問が生じたす。 幎末だけ、そしおおそらく 2020 幎だけ、倚くのこずが芋られるでしょう。

出所 habr.com

コメントを远加したす