Darating na ba ang panahon ng mga ARM server?

Darating na ba ang panahon ng mga ARM server?
SynQuacer E-Series motherboard para sa isang 24-core ARM server sa isang ARM Cortex A53 processor na may 32 GB ng RAM, Disyembre 2018

Sa loob ng maraming taon, ang mga processor ng ARM reduced instruction set (RISC) ay nangingibabaw sa merkado ng mobile device. Ngunit hindi nila nagawang makapasok sa mga sentro ng data, kung saan naghahari pa rin ang Intel at AMD sa set ng pagtuturo ng x86. Paminsan-minsan, lumilitaw ang mga indibidwal na kakaibang solusyon, tulad ng 24-core ARM server sa Banana Pi platform, ngunit wala pang seryosong panukala. Mas tiyak, hindi ito hanggang sa linggong ito.

Inilunsad ng AWS ang sarili nitong 64-core ARM processors sa cloud ngayong linggo Graviton2 ay isang system-on-chip na may ARM Neoverse N1 core. Sinasabi ng kumpanya na ang Graviton2 ay mas mabilis kaysa sa mga nakaraang henerasyong ARM processor sa mga pagkakataong EC2 A1, at narito ito unang mga independiyenteng pagsusulit.

Ang negosyo sa imprastraktura ay tungkol sa paghahambing ng mga numero. Sa katunayan, ang mga kliyente ng isang data center o cloud service ay walang pakialam kung anong arkitektura mayroon ang mga processor. Pinapahalagahan nila ang ratio ng presyo/pagganap. Kung ang pagpapatakbo sa ARM ay mas mura kaysa sa pagtakbo sa x86, sila ang pipiliin.

Hanggang kamakailan lamang, imposibleng sabihin nang walang pag-aalinlangan na ang pag-compute sa ARM ay magiging mas kumikita kaysa sa x86. Halimbawa, ang isang server na 24-core ARM Cortex A53 ay isang modelo SocioNext SC2A11 nagkakahalaga ng humigit-kumulang $1000, na maaaring magpatakbo ng isang web server sa Ubuntu, ngunit mas mababa ang pagganap sa x86 processor.

Gayunpaman, ang kahanga-hangang kahusayan sa enerhiya ng mga processor ng ARM ay paulit-ulit nating tinitingnan ang mga ito. Halimbawa, ang SocioNext SC2A11 ay gumagamit lamang ng 5 W. Ngunit ang kuryente ay halos 20% ng mga gastos ng isang data center. Kung ang mga chip na ito ay nagpapakita ng disenteng pagganap, ang x86 ay walang pagkakataon.

Ang Unang Pagdating ng ARM: EC2 A1 Instances

Sa pagtatapos ng 2018, ipinakilala ang AWS EC2 A1 instance sa aming sariling mga processor ng ARM. Ito ay talagang isang senyales sa industriya tungkol sa mga potensyal na pagbabago sa merkado, ngunit ang mga resulta ng benchmark ay nakakadismaya.

Ipinapakita ng talahanayan sa ibaba resulta ng stress testing EC2 A1 (ARM) at EC2 M5d.metal (x86) instance. Ang utility ay ginamit para sa pagsubok stress-ng:

stress-ng --metrics-brief --cache 16 --icache 16 --matrix 16 --cpu 16 --memcpy 16 --qsort 16 --dentry 16 --timer 16 -t 1m

Tulad ng nakikita mo, ang A1 ay gumanap nang mas malala sa lahat ng mga pagsubok maliban sa cache. Sa karamihan ng iba pang mga tagapagpahiwatig, ang ARM ay napakababa. Ang pagkakaiba sa pagganap na ito ay mas malaki kaysa sa 46% na pagkakaiba sa presyo sa pagitan ng A1 at M5. Sa madaling salita, ang mga instance sa mga x86 processor ay mayroon pa ring mas mahusay na ratio ng presyo/pagganap:

Pagsubok
EC2 A1
EC2 M5d.metal
Pagkakaiba

cache
1280
311
311,58%

icache
18209
34368
-47,02%

matris
77932
252190
-69,10%

CPU
9336
24077
-61,22%

memcpy
21085
111877
-81,15%

qsort
522
728
-28,30%

ngipin
1389634
2770985
-49.85%

hronometrahisto
4970125
15367075
-67,66%

Siyempre, hindi palaging nagpapakita ng layunin ang mga microbenchmark. Ang mahalaga ay ang pagkakaiba sa aktwal na pagganap ng aplikasyon. Ngunit narito ang larawan ay naging hindi mas mahusay. Inihambing ng mga kasamahan mula sa Scylla ang a1.metal at m5.4xlarge na mga instance na may parehong bilang ng mga processor. Sa isang karaniwang NoSQL database read test sa isang solong configuration ng node, ang una ay nagpakita ng 102 read operations bawat segundo, at ang pangalawang 000. Sa parehong mga kaso, ang lahat ng magagamit na mga processor ay ginagamit sa 610%. Ito ay katumbas ng humigit-kumulang anim na beses na pagbawas sa pagganap, na hindi nababawasan ng mas mababang presyo.

Bukod pa rito, tumatakbo lang ang mga A1 instance sa EBS nang walang suporta para sa mga mabibilis na NVMe device tulad ng ibang mga instance.

Sa pangkalahatan, ang A1 ay isang hakbang sa isang bagong direksyon, ngunit hindi ito tumupad sa inaasahan ng ARM.

Ang Ikalawang Pagdating ng ARM: EC2 M6 Instances

Darating na ba ang panahon ng mga ARM server?

Nagbago ang lahat sa linggong ito nang ipinakilala ng AWS ang isang bagong klase ng mga ARM server, pati na rin ang ilang mga pagkakataon sa mga bagong processor. Graviton2Kabilang M6g at M6gd.

Ang paghahambing sa mga pagkakataong ito ay nagpapakita ng ganap na kakaibang larawan. Sa ilang mga pagsubok, ang ARM ay gumaganap nang mas mahusay, at kung minsan ay mas mahusay, kaysa sa x86.

Narito ang mga resulta ng pagpapatakbo ng parehong stress test command:

Pagsubok
EC2 M6g
EC2 M5d.metal
Pagkakaiba

cache
218
311
-29,90%

icache
45887
34368
33,52%

matris
453982
252190
80,02%

CPU
14694
24077
-38,97%

memcpy
134711
111877
20,53%

qsort
943
728
29,53%

ngipin
3088242
2770985
11,45%

hronometrahisto
55515663
15367075
261,26%

Ito ay isang ganap na naiibang bagay: ang M6g ay limang beses na mas mabilis kaysa sa A1 kapag nagsasagawa ng mga read operation mula sa Scylla NoSQL database, at ang mga bagong M6gd instance ay tumatakbo nang mabilis sa mga NVMe drive.

ARM offensive sa lahat ng larangan

Ang AWS Graviton2 processor ay isa lamang halimbawa ng ARM na ginagamit sa mga data center. Ngunit ang mga signal ay nagmumula sa iba't ibang direksyon. Halimbawa, noong Nobyembre 15, 2019, ang American startup na Nuvia umakit ng $53 milyon sa venture funding.

Ang startup ay itinatag ng tatlong nangungunang inhinyero na kasangkot sa paglikha ng mga processor sa Apple at Google. Nangangako silang bubuo ng mga processor para sa mga data center na makikipagkumpitensya sa Intel at AMD.

Sa magagamit na impormasyonAng Nuvia ay nagdisenyo ng isang processor core mula sa simula na maaaring itayo sa ibabaw ng arkitektura ng ARM, ngunit nang hindi kumukuha ng lisensya ng ARM.

Ang lahat ng ito ay nagpapahiwatig na ang mga processor ng ARM ay handa nang sakupin ang merkado ng server. Pagkatapos ng lahat, nabubuhay tayo sa panahon ng post-PC. Bumaba ng halos 86% ang mga taunang pagpapadala ng x10 mula noong kanilang pinakamataas na 2011, habang ang RISC chips ay tumaas sa 20 bilyon. Ngayon, 99% ng 32- at 64-bit na processor sa mundo ay RISC.

Ang mga nanalo ng Turing Award na sina John Hennessy at David Patterson ay nag-publish ng isang artikulo noong Pebrero 2019 "Isang Bagong Ginintuang Panahon para sa Arkitektura ng Computer". Narito ang isinulat nila:

Naayos na ng merkado ang hindi pagkakaunawaan ng RISC-CISC. Bagama't nanalo ang CISC sa mga huling yugto ng panahon ng PC, ngunit nanalo ang RISC ngayong dumating na ang panahon ng post-PC. Walang bagong CISC ISA ang nalikha sa loob ng mga dekada. Sa aming sorpresa, ang pinagkasunduan sa pinakamahusay na mga prinsipyo ng ISA para sa mga pangkalahatang-layunin na mga processor ngayon ay nakasandal pa rin sa pabor sa RISC, 35 taon pagkatapos ng pag-imbento nito... Sa mga open source na ecosystem, ang mahusay na disenyo ng mga chips ay magpapakita ng mga nakakahimok na pag-unlad at sa gayon ay mapabilis ang komersyal na pag-aampon . Ang pangkalahatang layunin na pilosopiya ng processor sa mga chips na ito ay malamang na RISC, na nagtagumpay sa pagsubok ng panahon. Asahan ang parehong mabilis na pagbabago tulad noong huling ginintuang edad, ngunit sa pagkakataong ito sa mga tuntunin ng gastos, enerhiya at kaligtasan, hindi lamang sa pagganap.

"Sa susunod na dekada ay makikita ang isang Cambrian na pagsabog ng mga bagong arkitektura ng computer, na nagpapahiwatig ng mga kapana-panabik na oras para sa mga arkitekto ng computer sa akademya at industriya," pagtatapos nila sa papel.

Pinagmulan: www.habr.com

Magdagdag ng komento