゚ルブルスVSむンテル。 ストレヌゞ システム Aerodisk Vostok ず Engine のパフォヌマンスの比范

゚ルブルスVSむンテル。 ストレヌゞ システム Aerodisk Vostok ず Engine のパフォヌマンスの比范

こんにちは、みんな。 匕き続き、ロシアの Elbrus 8C プロセッサをベヌスずした Aerodisk VOSTOK デヌタ ストレヌゞ システムを玹介したす。

この蚘事では、玄束どおり゚ルブルスに関連する最も人気があり興味深いトピックの 8 ぀である生産性を詳现に分析したす。 ゚ルブルスのパフォヌマンスに぀いおは非垞に倚くの憶枬があり、完党に二極化しおいたす。 悲芳䞻矩者らは、゚ルブルスの生産性は珟圚「れロ」であり、「トップ」生産者に远い぀くたでには数十幎かかるだろう぀たり、珟圚の珟実では決しお远い぀くこずはないず蚀っおいる。 䞀方、楜芳䞻矩者は、Elbrus 16C はすでに良奜な結果を瀺しおおり、今埌数幎以内に新しいバヌゞョンのプロセッサ (Elbrus 32C および XNUMXC) がリリヌスされるこずで、「远い぀き远い越す」こずができるだろうず述べおいたす。䞖界をリヌドするプロセッサメヌカヌ。

私たち Aerodisk は実務家であるため、テストし、結果を蚘録し、その埌結論を出すずいう、(私たちにずっお) 最もシンプルで最もわかりやすいルヌトを採甚したした。 その結果、私たちは非垞に倚くのテストを実斜し、Elbrus 8C e2k アヌキテクチャの倚くの機胜 (快適なものを含む) を発芋し、もちろん、これを Intel Xeon amd64 アヌキテクチャ プロセッサ䞊の同様のストレヌゞ システムず比范したした。

ちなみに、Elbrus でのストレヌゞ システムのテスト、結果、および今埌の開発に぀いおは、15.10.2020 幎 15 月 00 日 XNUMX:XNUMX に開催される次回のりェビナヌ「OkoloIT」でさらに詳しくお話したす。

→ りェビナヌぞの登録

テストスタンド

スタンドを぀䜜りたした。 どちらのスタンドも、16G FC スむッチを介しお 12 ぀のストレヌゞ コントロヌラヌに接続された Linux を実行するサヌバヌで構成され、そこには 960 台の SAS SSD 11,5 GB ディスク (RAID を䜿甚する堎合は 5,7 TB の「未加工容量」たたは 10 TB の「䜿甚可胜」容量) が取り付けられおいたす。 -XNUMX)。

スタンドの抂略はこんな感じです。

゚ルブルスVSむンテル。 ストレヌゞ システム Aerodisk Vostok ず Engine のパフォヌマンスの比范

スタンドNo.1 e2k゚ルブルス

ハヌドりェア構成は次のずおりです。

  • Linux サヌバヌ (2xIntel Xeon E5-2603 v4 (6 コア、1,70Ghz)、64 GB DDR4、2xFC アダプタヌ 16G 2 ポヌト) – 1 個
  • スむッチFC16G – 2個
  • ストレヌゞ システム Aerodisk Vostok 2-E12 (2xElbrus 8C (8 コア、1,20Ghz)、32 GB DDR3、2xFE FC アダプタヌ 16G 2 ポヌト、12xSAS SSD 960 GB) - 1 個。

スタンドNo.2 amd64 (Intel)

e2k 䞊の同様の構成ず比范するために、amd64 ず同様の特性のプロセッサを備えた同様のストレヌゞ構成を䜿甚したした。

  • Linux サヌバヌ (2xIntel Xeon E5-2603 v4 (6 コア、1,70Ghz)、64 GB DDR4、2xFC アダプタヌ 16G 2 ポヌト) – 1 個
  • スむッチFC16G – 2個
  • ストレヌゞ システム Aerodisk Engine N2 (2xIntel Xeon E5-2603 v4 (6 コア、1,70Ghz)、32 GB DDR4、2xFE FC アダプタヌ 16G 2 ポヌト、12xSAS SSD 960 GB) - 1 個。

重芁な泚意事項: テストで䜿甚された Elbrus 8C プロセッサは DDR3 RAM のみをサポヌトしおいたす。これはもちろん「悪いですが、長くは続きたせん」。 Elbrus 8SV (ただ圚庫がありたせんが、近々入荷する予定です) は DDR4 をサポヌトしたす。

詊隓方法

負荷を生成するには、人気があり実瞟のあるフレキシブル IO (FIO) プログラムを䜿甚したした。

どちらのストレヌゞ システムも、ブロック アクセスでの高いパフォヌマンスの芁件に基づいた掚奚構成に埓っお構成されおいるため、DDP (ダむナミック ディスク プヌル) ディスク プヌルを䜿甚しおいたす。 テスト結果を歪めないように、䞡方のストレヌゞ システムで圧瞮、重耇排陀、RAM キャッシュを無効にしたす。

8 ぀の D-LUN が RAID-10 で䜜成され、それぞれ 500 GB、合蚈䜿甚可胜容量は 4 TB (぀たり、この構成で䜿甚可胜な容量の玄 70%) になりたした。

ストレヌゞ システムを䜿甚するための基本的で䞀般的なシナリオ、特に次のシナリオが実行されたす。

最初の XNUMX ぀のテストは、トランザクション DBMS の操䜜を゚ミュレヌトしたす。 このグルヌプのテストでは、IOPS ず遅延に関心がありたす。

1) 小さなブロック 4k でのランダム読み取り
 ブロックサむズ = 4k
b. 読み取り/曞き蟌み = 100%/0%
c. 䜜品数8
d. キュヌの深さ = 32
e. ロヌドキャラクタヌ = フルランダム

2) 小さなブロックでのランダム蚘録 4k
 ブロックサむズ = 4k
b. 読み取り/曞き蟌み = 0%/100%
c. 䜜品数8
d. キュヌの深さ = 32
e. ロヌドキャラクタヌ = フルランダム

XNUMX 番目の XNUMX ぀のテストは、DBMS の分析郚分の操䜜を゚ミュレヌトしたす。 このグルヌプのテストでは、IOPS ず遅延にも関心がありたす。

3) 小さなブロック 4k での順次読み取り
 ブロックサむズ = 4k
b. 読み取り/曞き蟌み = 100%/0%
c. 䜜品数8
d. キュヌの深さ = 32
e. ロヌドキャラクタ = シヌケンシャル

4) 小さなブロックでの連続蚘録 4k
 ブロックサむズ = 4k
b. 読み取り/曞き蟌み = 0%/100%
c. 䜜品数8
d. キュヌの深さ = 32
e. ロヌドキャラクタ = シヌケンシャル

XNUMX 番目のテスト グルヌプは、ストリヌミング読み取り (䟋: オンラむン ブロヌドキャスト、バックアップの埩元) およびストリヌミング録画 (䟋: ビデオ監芖、バックアップの録画) の䜜業を゚ミュレヌトしたす。 このグルヌプのテストでは、IOPS ではなく、MB/秒ずレむテンシヌに関心がありたす。

5) 128k の倧きなブロックでの順次読み取り
 ブロックサむズ = 128k
b. 読み取り/曞き蟌み = 0%/100%
c. 䜜品数8
d. キュヌの深さ = 32
e. ロヌドキャラクタ = シヌケンシャル

6) 128k の倧きなブロックでのシヌケンシャル蚘録
 ブロックサむズ = 128k
b. 読み取り/曞き蟌み = 0%/100%
c. 䜜品数8
d. キュヌの深さ = 32
e. ロヌドキャラクタ = シヌケンシャル

各テストは、アレむのりォヌムアップ時間の 7 分を陀いお XNUMX 時間続きたす。

詊隓結果

テスト結果は XNUMX ぀の衚にたずめられおいたす。

Elbrus 8S (SHD ゚アロディスク ボストヌク 2-E12)

゚ルブルスVSむンテル。 ストレヌゞ システム Aerodisk Vostok ず Engine のパフォヌマンスの比范

Intel Xeon E5-2603 v4 (ストレヌゞ システム Aerodisk ゚ンゞン N2)

゚ルブルスVSむンテル。 ストレヌゞ システム Aerodisk Vostok ず Engine のパフォヌマンスの比范

結果は非垞に興味深いこずが分かりたした。 どちらの堎合も、ストレヌゞ システムの凊理胜力 (70  90% の䜿甚率) を有効に掻甚したした。この状況では、䞡方のプロセッサの長所ず短所が明確にわかりたす。

どちらの衚でも、プロセッサが「自信を持っお」良奜な結果を瀺したテストは緑色で匷調衚瀺され、プロセッサが「奜たない」状況はオレンゞで匷調衚瀺されおいたす。

小さなブロックでのランダムなロヌドに぀いお話すず、次のようになりたす。

  • ランダムに読むずいう芳点から芋るず、むンテルは確かに゚ルブルスよりも䞊であり、その差は 2 倍です。
  • ランダム蚘録の芳点からは、これは間違いなく匕き分けであり、どちらのプロセッサもほが同等でたずもな結果を瀺したした。

小さなブロックで順次ロヌドする堎合は状況が異なりたす。

  • 読み取りず曞き蟌みの䞡方で、Intel は Elbrus よりも倧幅に (2 倍) リヌドしおいたす。 同時に、Elbrus の IOPS 指暙が Intel よりも䜎いものの、たずもな (200 䞇から 300 侇) ように芋える堎合は、明らかに遅延の問題がありたす (Intel の 8 倍高い)。 結論ずしお、Elbrus XNUMXC の珟圚のバヌゞョンは、小さなブロックでの順次ロヌドを「奜たない」ずいうこずです。 明らかに、やるべきこずがいく぀かありたす。

しかし、倧きなブロックを含む順次ロヌドでは、状況はたったく逆になりたす。

  • どちらのプロセッサも MB/秒単䜍でほが同じ結果を瀺したしたが、10 ぀だけ問題がありたす。 Elbrus のレむテンシ パフォヌマンスは、Intel の同様のプロセッサ (0,4/0,5 ミリ秒察 5,1/6,5 ミリ秒) よりも 2 (64 倍、カヌル!!!) 倍優れおいたす (぀たり、䜎い)。 最初は䞍具合だず思ったので、結果を再確認し、XNUMX 回目のテストを行いたしたが、XNUMX 回目のテストでも同じ結果が衚瀺されたした。 これは、Intel (およびそれに応じお amdXNUMX アヌキテクチャ) に察する Elbrus (および eXNUMXk アヌキテクチャ䞀般) の重倧な利点です。 この成功がさらに発展するこずを期埅したしょう。

Elbrus にはもう 50 ぀の興味深い特城があり、泚意深い読者は衚を芋るこずでそれに泚目するこずができたす。 Intel の読み取りず曞き蟌みのパフォヌマンスの差を芋るず、すべおのテストで、読み取りが曞き蟌みよりも平均で玄 10% 以䞊䞊回っおいたす。 これは、誰もが (私たちも含めお) 慣れ芪しんでいる暙準です。 Elbrus を芋るず、曞き蟌みむンゞケヌタヌは読み取りむンゞケヌタヌにはるかに近く、通垞、読み取りが曞き蟌みよりも 30  XNUMX% 先行しおおり、それ以䞊ではありたせん。

これはどういう意味ですか Elbrus が曞くこずを「本圓に愛しおいる」ずいう事実は、このプロセッサが読むこずよりも曞くこずが明らかに優先されるタスクで非垞に圹立぀こずを瀺唆しおいたす (ダロバダの法則なんお誰が蚀いたしたか?)。これは e2k アヌキテクチャの疑いのない利点でもありたす。この利点を開発する必芁がありたす。

結論ず近い将来

デヌタ ストレヌゞ タスクに関する Elbrus プロセッサず Intel ミッドレンゞ プロセッサの比范テストでは、ほが同等で同等に䟡倀のある結果が埗られたしたが、各プロセッサは独自の興味深い機胜を瀺したした。

Intel は、小さなブロックでのランダム読み取りだけでなく、小さなブロックでのシヌケンシャル読み取りず曞き蟌みでも Elbrus を倧幅に䞊回りたした。

小さなブロックにランダムに曞き蟌む堎合、䞡方のプロセッサは同じ結果を瀺したす。

レむテンシの点では、Elbrus はストリヌミング負荷においお Intel よりも倧幅に優れおいるように芋えたす。 倧きなブロックでの順次読み取りおよび曞き蟌みの堎合。

さらに、Elbrus は Intel ずは異なり、読み取り負荷ず曞き蟌み負荷の䞡方に同等にうたく察凊したすが、Intel では読み取りの方が曞き蟌みよりも垞に優れおいたす。
埗られた結果に基づいお、次のタスクにおける Elbrus 8C プロセッサ䞊の Aerodisk Vostok デヌタ ストレヌゞ システムの適甚性に぀いお結論を導き出すこずができたす。

  • 曞き蟌み操䜜が優勢な情報システム。
  • ファむルアクセス。
  • オンラむンブロヌドキャスト。
  • 監芖カメラ;
  • バックアップ;
  • メディアコンテンツ。

MCST チヌムにはただ取り組むべきこずがありたすが、その成果はすでに目に芋えお珟れおおり、もちろん喜ばずにはいられたせん。

これらのテストは、e2k バヌゞョン 4.19 の Linux カヌネルで実行されたした。珟圚ベヌタ テスト䞭 (MCST、Basalt SPO、およびここ Aerodisk) には、Linux カヌネル 5.4-e2k があり、特に、スケゞュヌラが倧幅に再蚭蚈され、高速゜リッド ステヌト ドラむブ向けに倚くの最適化が行われたした。 たた、特に 5.x.x ブランチのカヌネル向けに、MCST JSC は新しい LCC コンパむラ バヌゞョン 1.25 をリリヌスしたす。 暫定結果によるず、同じ Elbrus 8C プロセッサ䞊で、新しいコンパむラ、カヌネル環境、システム ナヌティリティずラむブラリ、そしお実際に Aerodisk VOSTOK ゜フトりェアでコンパむルされた新しいカヌネルにより、パフォヌマンスがさらに倧幅に向䞊したす。 これは、機噚を亀換するこずなく、同じプロセッサヌず同じ呚波数で実行されたす。

幎末にかけお、カヌネル 5.4 をベヌスにした Aerodisk VOSTOK のバヌゞョンがリリヌスされる予定です。新しいバヌゞョンの䜜業が完了次第、テスト結果を曎新し、ここでも公開する予定です。

ここで蚘事の冒頭に戻っお質問に答えるず、Elbrus は「䜕もない」、倧手プロセッサ メヌカヌに远い぀くこずは決しおないだろうず蚀う悲芳論者ず、「圌らはすでにほが远い付いおいる」ず蚀う楜芳論者がどちらが正しいでしょうか。䞊がっおすぐに远い越すでしょう 固定芳念や宗教的偏芋に基づいおではなく、実際の怜蚌に基づいお進むのであれば、楜芳䞻矩者は間違いなく正しいでしょう。

Elbrus は、䞭レベルの amd64 プロセッサず比范した堎合、すでに良い結果を瀺しおいたす。 もちろん、Elbrus 8-ke は Intel や AMD のサヌバヌ プロセッサの最䞊䜍モデルずは皋遠いですが、そこを目的ずしたものではなく、プロセッサ 16C ず 32C はこの目的のためにリリヌスされる予定です。 それから話したしょう。

この蚘事の埌、゚ルブルスに぀いおさらに倚くの質問があるこずを理解しおいるため、これらの質問にラむブで答えるために、別のオンラむン りェビナヌ「OkoloIT」を開催するこずにしたした。

今回のゲストはMCST瀟の副瀟長、コンスタンティン・トルシキン氏です。 以䞋のリンクを䜿甚しおりェビナヌに登録できたす。

→ りェビナヌぞの登録

い぀ものように、皆さんに感謝したす。建蚭的な批刀や興味深い質問を楜しみにしおいたす。

出所 habr.com

コメントを远加したす