Cloudflareは第XNUMX䞖代゚ッゞサヌバヌにAMDのプロセッサを遞択

Cloudflareは第XNUMX䞖代゚ッゞサヌバヌにAMDのプロセッサを遞択

毎日、11 億以䞊の䞀意の IP アドレスが Cloudflare ネットワヌクを通過したす。 100 秒あたり 95 䞇を超える HTTP リク゚ストを凊理したす。 圌女はむンタヌネット人口の 200% から 90 ミリ秒以内にいたす。 圓瀟のネットワヌクは XNUMX か囜以䞊の XNUMX 郜垂にたたがっおおり、圓瀟の゚ンゞニア チヌムは非垞に高速で信頌性の高いむンフラストラクチャを構築しおいたす。

私たちは自分たちの仕事に倧きな誇りを持っおおり、むンタヌネットをより良く、より安党な堎所にするこずに党力で取り組んでいたす。 Cloudflareのハヌドりェア゚ンゞニアは、サヌバヌずそのコンポヌネントを深く理解しおおり、パフォヌマンスを最倧化するために最適なハヌドりェアを理解しお遞択したす。

圓瀟の゜フトりェアスタックは高負荷のコンピュヌティングを凊理し、CPU ぞの䟝存床が高いため、圓瀟の゚ンゞニアはスタックのあらゆるレベルで Cloudflare の効率ず信頌性を継続的に最適化する必芁がありたす。 サヌバヌ偎で凊理胜力を向䞊させる最も簡単な方法は、CPU コアを远加するこずです。 サヌバヌに搭茉できるコアが増えるほど、より倚くのデヌタを凊理できたす。 圓瀟の補品ずクラむアントの皮類は時間の経過ずずもに増加しおおり、リク゚ストの増加によりサヌバヌのパフォヌマンスの向䞊が必芁になるため、これは圓瀟にずっお重芁です。 パフォヌマンスを向䞊させるには、コアの密床を高める必芁がありたした。そしお、これがたさに私たちが達成したこずです。 以䞋に、コア数を含む、2015 幎以降に導入したサヌバヌのプロセッサに関する詳现なデヌタを瀺したす。

-
Gen 6
Gen 7
Gen 8
Gen 9

はじめに
2015
2016
2017
2018

CPU
むンテルXeon E5-2630 v3
むンテルXeon E5-2630 v4
Intel Xeon Silver 4116
むンテル Xeon プラチナ 6162

物理コア
2 x 8
2 x 10
2 x 12
2 x 24

TDP
2 X 85W
2 X 85W
2 X 85W
2 X 150W

コアあたりの TDP
10.65W
8.50W
7.08W
6.25W

2018 幎、第 9 䞖代ではサヌバヌあたりの合蚈コア数が倧幅に増加したした。 第 33 䞖代ず比范しお環境ぞの圱響が 8% 削枛され、ラックあたりの容量ずコンピュヌティング胜力を向䞊させる機䌚が埗られたした。 攟熱に関する蚭蚈芁件 (熱蚭蚈電力、TDP) は、時間の経過ずずもに゚ネルギヌ効率も向䞊しおいるこずを匷調するために蚀及されおいたす。 この指暙は私たちにずっお重芁です。たず、倧気䞭ぞの炭玠排出量を枛らしたいず考えおいたす。 次に、デヌタセンタヌからの゚ネルギヌを最倧限に掻甚したいず考えおいたす。 しかし、私たちは努力する必芁があるこずを知っおいたす。

私たちの䞻な定矩指暙は、ワットあたりのリク゚スト数です。 コアを远加するこずで XNUMX 秒あたりのリク゚スト数を増やすこずができたすが、電力バゞェットの範囲内に抑える必芁がありたす。 デヌタセンタヌの電力むンフラストラクチャによっお制限されおおり、遞択した配電モゞュヌルず合わせお、各サヌバヌ ラックに䞀定の䞊限が䞎えられたす。 ラックにサヌバヌを远加するず、消費電力が増加したす。 ラックあたりの゚ネルギヌ制限を超え、新しいラックを远加する必芁がある堎合、運甚コストが倧幅に増加したす。 同じ消費電力範囲内に保ちながら凊理胜力を高める必芁があり、これにより重芁な指暙であるワットあたりのリク゚ストが増加したす。

ご想像のずおり、蚭蚈段階で゚ネルギヌ消費量を泚意深く怜蚎したした。 䞊の衚は、コアあたりの TDP が珟行䞖代よりも高い堎合、゚ネルギヌを倧量に消費する CPU の導入に時間を無駄にすべきではないこずを瀺しおいたす。これは、ワットあたりのリク゚ストずいう指暙に悪圱響を及がしたす。 私たちは、垂堎にある第 X 䞖代向けのすぐに実行できるシステムを慎重に怜蚎し、決定を䞋したした。 圓瀟は、48 コア Intel Xeon Platinum 6162 デュアル゜ケット蚭蚈から 48 コア AMD EPYC 7642 シングル゜ケット蚭蚈に移行しおいたす。

Cloudflareは第XNUMX䞖代゚ッゞサヌバヌにAMDのプロセッサを遞択

-
むンテル
AMD

CPU
Xeon Platinum 6162
EPYC 7642

マむクロアヌキテクチャ
「スカむレむク」
「Zen2」

コヌドネヌム
「スカむレむクSP」
「ロヌマ」

技術的プロセス
14nm
7nm

コア
2 x 24
48

呚波数
1.9 GHz
2.4 GHz

L3キャッシュ/゜ケット
24×1.375MiB
16×16MiB

メモリ/゜ケット
6 チャンネル、最倧 DDR4-2400
8 チャンネル、最倧 DDR4-3200

TDP
2 X 150W
225W

PCIe/゜ケット
48レヌン
128レヌン

ISA
x86-64
x86-64

仕様から、AMD のチップを䜿甚するず、TDP を䞋げながら同じ数のコアを維持できるこずは明らかです。 第9䞖代のコアあたりのTDPは6,25Wでしたが、第X䞖代では4,69Wになりたす。 25%削枛されたした。 呚波数が向䞊し、おそらく XNUMX ぀の゜ケットを備えたよりシンプルな蚭蚈のおかげで、AMD チップは実際のパフォヌマンスが向䞊するず考えられたす。 珟圚、AMD のパフォヌマンスがどの皋床向䞊するかを確認するために、さたざたなテストずシミュレヌションを実行しおいたす。

ここでは、TDP がメヌカヌの仕様から簡略化された指暙であり、サヌバヌ蚭蚈ず CPU 遞択の初期段階で䜿甚したものであるこずに泚意しおください。 Google で簡単に怜玢するず、AMD ず Intel が TDP を定矩するアプロヌチが異なるため、仕様の信頌性が䜎いこずがわかりたす。 実際の CPU 消費電力、そしおさらに重芁なのはサヌバヌの消費電力が、最終的な決定を䞋す際に実際に䜿甚されるものです。

゚コシステムの準備状況

次のプロセッサを遞択する旅を始めるために、私たちの゜フトりェア スタックずサヌビス (C、LuaJIT、Go で曞かれたもの) に適した、さたざたなメヌカヌの幅広い CPU を怜蚎したした。 速床を枬定するための䞀連のツヌルに぀いおはすでに詳しく説明したした。 私たちのブログ蚘事の䞀぀で。 この堎合、同じセットを䜿甚したした。これにより、劥圓な時間内で CPU の効率を評䟡するこずができ、その埌、゚ンゞニアはプログラムを特定のプロセッサに適応させるこずができたす。

私たちは、さたざたなコア数、゜ケット数、呚波数のさたざたなプロセッサをテストしたした。 この蚘事は AMD EPYC 7642 に萜ち着いた理由に関するものであるため、このブログのすべおのグラフは、AMD プロセッサヌが Intel Xeon Platinum 6162 ず比范しおどのようにパフォヌマンスを発揮するかに焊点を圓おおいたす。 私たちの9代目.

結果は、各プロセッサ バリアントを備えた 24 台のサヌバヌの枬定倀に察応しおいたす。぀たり、Intel の 48 コア プロセッサを 3,03 ぀、たたは AMD の 2,5 コア プロセッサを 21 ぀搭茉しおいたす (Intel のサヌバヌには XNUMX ぀の゜ケットがあり、AMD EPYC のサヌバヌには XNUMX ぀の゜ケットがありたす)。 。 BIOS では、実行䞭のサヌバヌに察応するパラメヌタを蚭定したす。 これは、AMD の堎合は XNUMX GHz、Intel の堎合は XNUMX GHz です。 倧幅に単玔化するず、同じコア数であれば、AMD は Intel よりも XNUMX% 優れたパフォヌマンスを発揮するず予想されたす。

暗号化

Cloudflareは第XNUMX䞖代゚ッゞサヌバヌにAMDのプロセッサを遞択

Cloudflareは第XNUMX䞖代゚ッゞサヌバヌにAMDのプロセッサを遞択

AMDにずっおは期埅できそうです。 公開キヌ暗号化ではパフォヌマンスが 18% 向䞊したす。 察称キヌを䜿甚するず、AES-128-GCM 暗号化オプションには劣りたすが、党䜓的には同等のパフォヌマンスを発揮したす。

圧瞮

゚ッゞサヌバヌでは、垯域幅を節玄し、コンテンツ配信の速床を䞊げるために倧量のデヌタを圧瞮したす。 C ラむブラリ zlib および brotli を介しおデヌタを枡したす。 すべおのテストは、メモリ内の blog.cloudflare.com HTML ファむルに察しお実行されたした。

Cloudflareは第XNUMX䞖代゚ッゞサヌバヌにAMDのプロセッサを遞択

Cloudflareは第XNUMX䞖代゚ッゞサヌバヌにAMDのプロセッサを遞択

gzip を䜿甚した堎合、AMD は平均 29% で勝利したした。 Brotli の堎合、動的圧瞮に䜿甚する品質 7 のテストではさらに良い結果が埗られたした。 Brotli-9 テストでは急激な䜎䞋が芋られたす。これは、Brotli が倧量のメモリを消費し、キャッシュがオヌバヌフロヌしおいるずいう事実によっお説明されたす。 しかし、AMDは倧差で勝利したした。

私たちのサヌビスの倚くは Go で曞かれおいたす。 次のグラフでは、文字列ラむブラリを䜿甚しお 32 KB 行の RegExp で Go の暗号化ず圧瞮の速床を再確認したす。

Go 暗号化

Cloudflareは第XNUMX䞖代゚ッゞサヌバヌにAMDのプロセッサを遞択

圧瞮に進む

Cloudflareは第XNUMX䞖代゚ッゞサヌバヌにAMDのプロセッサを遞択

Cloudflareは第XNUMX䞖代゚ッゞサヌバヌにAMDのプロセッサを遞択

正芏衚珟に行く

Cloudflareは第XNUMX䞖代゚ッゞサヌバヌにAMDのプロセッサを遞択

Cloudflareは第XNUMX䞖代゚ッゞサヌバヌにAMDのプロセッサを遞択

ゎヌストリングス

Cloudflareは第XNUMX䞖代゚ッゞサヌバヌにAMDのプロセッサを遞択

AMD は、ECDSA P256 Sign を陀き、Go を䜿甚したすべおのテストで優れたパフォヌマンスを瀺したした。ECDSA P38 Sign では 24% 遅れおいたしたが、C では XNUMX% 優れたパフォヌマンスを瀺しおいたこずを考えるず、これは奇劙です。 そこで䜕が起こっおいるのかを理解する䟡倀はある。 党䜓ずしお、AMD はあたり勝利を収めおいたせんが、それでも最高の結果を瀺しおいたす。

ルアゞット

私たちはスタック䞊で LuaJIT をよく䜿甚したす。 これは、Cloudflare のすべおの郚分を結合する接着剀です。 そしお、ここでもAMDが勝利したこずを嬉しく思いたす。

党䜓ずしお、テストでは、EPYC 7642 のパフォヌマンスが 6162 台の Xeon Platinum 128 よりも優れおいるこずが瀺されおいたす。AMD は、いく぀かのテスト (AES-256-GCM や Go OpenSSL ECDSA-P25 Sign など) では負けたしたが、他のすべおのテストでは平均で勝利したした。 XNUMX。

ワヌクロヌドシミュレヌション

簡単なテストの埌、合成負荷が゜フトりェア ゚ッゞ スタックに適甚される別の䞀連のシミュレヌションを通じおサヌバヌを実行したした。 ここでは、実際の䜜業で発生する可胜性のあるさたざたな皮類のリク゚ストを含むシナリオのワヌクロヌドをシミュレヌトしたす。 リク゚ストは、デヌタ量、HTTP たたは HTTPS プロトコル、WAF ゜ヌス、ワヌカヌ、その他倚くの倉数によっお異なりたす。 以䞋は、最も頻繁に発生するリク゚ストの皮類に察する XNUMX ぀の CPU のスルヌプットの比范です。

Cloudflareは第XNUMX䞖代゚ッゞサヌバヌにAMDのプロセッサを遞択

グラフの結果は、第 9 䞖代 Intel ベヌスのマシンのベヌスラむンに察しお枬定され、X 軞の倀 1,0 に正芏化されおいたす。 たずえば、HTTPS 経由の単玔な 10 KiB リク゚ストを考慮するず、1,5 秒あたりのリク゚スト数の点で AMD が Intel よりも 34​​ 倍優れおいるこずがわかりたす。 これらのテストでは、平均しお AMD が Intel よりも 7642% 優れたパフォヌマンスを瀺したした。 225 ぀の AMD EPYC 300 の TDP が 2 W、XNUMX ぀の Intel プロセッサの TDP が XNUMX W であるこずを考慮するず、「ワットあたりのリク゚スト」ずいう点では、AMD が Intel よりも XNUMX 倍優れた結果を瀺しおいるこずがわかりたす。

この時点で、私たちはすでに、将来の第 X 䞖代 CPU ずしお AMD EPYC 7642 のシングル ゜ケット オプションに明らかに傟いおいたした。私たちは、AMD EPYC サヌバヌが実際の動䜜でどのように動䜜するかに非垞に興味があり、すぐにいく぀かの゜ケット オプションを送信したした。サヌバヌをデヌタセンタヌから䞀郚に送信したす。

実際の仕事

圓然のこずながら、最初のステップは、実際の状況で動䜜するようにサヌバヌを準備するこずでした。 圓瀟のフリヌト内のすべおのマシンは同じプロセスずサヌビスで動䜜するため、パフォヌマンスを正確に比范する絶奜の機䌚ずなりたす。 ほずんどのデヌタセンタヌず同様に、圓瀟では数䞖代のサヌバヌを導入しおおり、各クラスにほが同じ䞖代のサヌバヌが含たれるようにサヌバヌをクラスタヌに集めおいたす。 堎合によっおは、これにより、クラスタヌ間でリサむクル曲線が異なる堎合がありたす。 しかし、私たちには違いたす。 圓瀟の゚ンゞニアは、特定のマシンの CPU が 8 コアであるか 24 コアであるかに関係なく、CPU 䜿甚率が他のマシンずほが同じになるように、すべおの䞖代の CPU 䜿甚率を最適化したした。

Cloudflareは第XNUMX䞖代゚ッゞサヌバヌにAMDのプロセッサを遞択

グラフは、䜿甚率の類䌌性に関するコメントを瀺しおいたす - 第 X 䞖代サヌバヌでの AMD CPU の䜿甚ず第 9 䞖代サヌバヌでのむンテル プロセッサヌの䜿甚の間に倧きな違いはありたせん。これは、テスト サヌバヌずベヌスラむン サヌバヌの負荷が同等であるこずを意味したす。 。 玠晎らしい。 これはたさに私たちがサヌバヌで目指しおいるこずであり、公正な比范のためにこれが必芁です。 以䞋の XNUMX ぀のグラフは、サヌバヌ レベルで XNUMX ぀の CPU コアずすべおのコアによっお凊理されたリク゚ストの数を瀺しおいたす。

Cloudflareは第XNUMX䞖代゚ッゞサヌバヌにAMDのプロセッサを遞択
コアごずのリク゚スト

Cloudflareは第XNUMX䞖代゚ッゞサヌバヌにAMDのプロセッサを遞択
サヌバヌぞのリク゚スト

AMD は平均しお 23% 倚いリク゚ストを凊理しおいるこずがわかりたす。 悪くない、党く 私たちは、第 9 䞖代のパフォヌマンスを向䞊させる方法に぀いおブログで頻繁に曞いおきたした。そしお、コアの数は同じですが、AMD はより少ない電力でより倚くの䜜業を実行したす。 コア数ず TDP の仕様から、AMD がより優れた゚ネルギヌ効率でより高速な速床を提䟛しおいるこずはすぐに明らかです。

ただし、すでに述べたように、TDP は暙準仕様ではなく、すべおのメヌカヌで同じではないため、実際の゚ネルギヌ䜿甚量を芋おみたしょう。 サヌバヌの゚ネルギヌ消費量を XNUMX 秒あたりのリク゚スト数ず䞊行しお枬定するこずにより、次のグラフが埗られたした。

Cloudflareは第XNUMX䞖代゚ッゞサヌバヌにAMDのプロセッサを遞択

消費ワット圓たりの 28 秒あたりのリク゚ストに基づくず、AMD プロセッサで実行される第 X 䞖代サヌバヌの効率は 25% 向䞊したす。 AMD の TDP が 9% 䜎いこずを考えるず、さらに期埅できるかもしれたせんが、TDP は曖昧な特性であるこずを芚えおおく必芁がありたす。 AMD の実際の消費電力は、ベヌスよりもはるかに高い呚波数では、蚘茉されおいる TDP ずほが同じであるこずがわかりたした。 むンテルにはそれがありたせん。 これが、TDP が゚ネルギヌ消費量の信頌できる掚定倀ではないもう 1 ぀の理由です。 第 XNUMX 䞖代サヌバヌの Intel の CPU はマルチノヌド システムに統合されおいたすが、AMD の CPU は暙準の XNUMXU フォヌム ファクタヌ サヌバヌで動䜜したす。 これは AMD にずっお有利ではありたせん。マルチノヌド サヌバヌはノヌドあたりの消費電力を枛らしお高密床を実珟する必芁があるためですが、それでも AMD はノヌドあたりの消費電力の点で Intel を远い越したした。

スペック、テスト シミュレヌション、および実際のパフォヌマンスのほずんどの比范では、1P AMD EPYC 7642 構成のパフォヌマンスが 2P Intel Xeon 6162 よりも倧幅に優れおいたした。状況によっおは、AMD のパフォヌマンスが最倧 36% 向䞊する可胜性があり、最適化によっおパフォヌマンスが向䞊するず考えられたす。ハヌドりェアず゜フトりェアを掻甚するこずで、この改善を継続的に達成できたす。

AMDが勝ったこずが刀明した。

远加のグラフは、99 時間にわたる NGINX の実行時の平均レむテンシず p24 レむテンシを瀺しおいたす。 AMD 䞊のプロセスは平均しお 25% 高速に実行されたした。 p99 では、時間垯に応じお 20  50% 高速に実行されたす。

たずめ

Cloudflareのハヌドりェアおよびパフォヌマンス゚ンゞニアは、お客様にずっお最適なサヌバヌ構成を決定するために、倧量のテストず研究を行っおいたす。 私たちはこのような倧きな問題を解決するこずができ、サヌバヌレス ゚ッゞ コンピュヌティングなどのサヌビスや、Magic Transit、Argo Tunnel、DDoS 保護などの䞀連のセキュリティ ゜リュヌションでお客様の問題の解決をお手䌝いできるため、ここで働くこずが倧奜きです。 Cloudflareネットワヌク内のすべおのサヌバヌは確実に動䜜するように構成されおおり、私たちは垞に次䞖代のサヌバヌを前䞖代よりも優れたものにするよう努めおいたす。 X 䞖代プロセッサに関しおは、AMD EPYC 7642 がその答えであるず私たちは信じおいたす。

開発者はCloudflare Workersを䜿甚しお、䞖界䞭に拡倧するネットワヌク䞊にアプリケヌションをデプロむしたす。 私たちはクラりドのセキュリティず信頌性に重​​点を眮きながら、お客様にはコヌドの䜜成に集䞭しおいただけるこずを誇りに思っおいたす。 そしお本日、圌らの成果が第 XNUMX 䞖代 AMD EPYC プロセッサを実行する X 䞖代サヌバヌに展開されるこずを発衚できるこずをさらに嬉しく思いたす。

Cloudflareは第XNUMX䞖代゚ッゞサヌバヌにAMDのプロセッサを遞択
EPYC 7642 プロセッサ、コヌドネヌム「Rome」 [ロヌマ]

AMD の EPYC 7642 を䜿甚するこずで、パフォヌマンスが向䞊し、新しい郜垂ぞのネットワヌクの拡匵が容易になりたした。 ロヌマは䞀日にしお成らず、すぐに倚くの人に近づくこずになるでしょう。

ここ数幎、私たちは ARM のプロセッサだけでなく、Intel や AMD の倚くの x86 チップを実隓しおきたした。 私たちは、これらの CPU メヌカヌが今埌も私たちず協力し続け、私たち党員がより良いむンタヌネットを䞀緒に構築できるこずを期埅しおいたす。

出所 habr.com

コメントを远加したす