Adakah era pelayan ARM akan datang?

Adakah era pelayan ARM akan datang?
Papan induk SynQuacer E-Series untuk pelayan ARM 24-teras pada pemproses ARM Cortex A53 dengan 32 GB RAM, Disember 2018

Selama bertahun-tahun, pemproses set arahan berkurangan ARM (RISC) telah menguasai pasaran peranti mudah alih. Tetapi mereka tidak pernah berjaya memecah masuk ke pusat data, di mana Intel dan AMD masih memerintah dengan set arahan x86. Dari semasa ke semasa, penyelesaian eksotik individu muncul, seperti Pelayan ARM 24 teras pada platform Banana Pi, tetapi belum ada cadangan yang serius. Lebih tepat lagi, ia tidak sampai minggu ini.

AWS melancarkan pemproses ARM 64-teras sendiri dalam awan minggu ini Graviton2 ialah sistem pada cip dengan teras ARM Neoverse N1. Syarikat itu mendakwa bahawa Graviton2 jauh lebih pantas daripada pemproses ARM generasi sebelumnya dalam keadaan EC2 A1, dan inilah ujian bebas pertama.

Perniagaan infrastruktur adalah tentang membandingkan nombor. Malah, pelanggan pusat data atau perkhidmatan awan tidak peduli dengan seni bina yang dimiliki oleh pemproses. Mereka mengambil berat tentang nisbah harga/prestasi. Jika berjalan pada ARM adalah lebih murah daripada berjalan pada x86, maka ia akan dipilih.

Sehingga baru-baru ini, adalah mustahil untuk mengatakan dengan jelas bahawa pengkomputeran pada ARM akan lebih menguntungkan daripada pada x86. Sebagai contoh, pelayan 24-teras ARM Cortex A53 ialah model SocioNext SC2A11 berharga kira-kira $1000, yang boleh menjalankan pelayan web di Ubuntu, tetapi prestasinya jauh lebih rendah daripada pemproses x86.

Walau bagaimanapun, kecekapan tenaga menakjubkan pemproses ARM membuatkan kami melihatnya lagi dan lagi. Sebagai contoh, SocioNext SC2A11 menggunakan hanya 5 W. Tetapi elektrik menyumbang hampir 20% daripada kos pusat data. Jika cip ini menunjukkan prestasi yang baik, maka x86 tidak akan mempunyai peluang.

Kedatangan Pertama ARM: EC2 A1 Instances

Pada penghujung tahun 2018, AWS diperkenalkan Contoh EC2 A1 pada pemproses ARM kami sendiri. Ini sudah pasti isyarat kepada industri tentang potensi perubahan dalam pasaran, tetapi keputusan penanda aras mengecewakan.

Jadual di bawah menunjukkan keputusan ujian tekanan Kejadian EC2 A1 (ARM) dan EC2 M5d.metal (x86). Utiliti digunakan untuk ujian stress-ng:

stress-ng --metrics-brief --cache 16 --icache 16 --matrix 16 --cpu 16 --memcpy 16 --qsort 16 --dentry 16 --timer 16 -t 1m

Seperti yang anda lihat, A1 menunjukkan prestasi yang lebih teruk dalam semua ujian kecuali cache. Dalam kebanyakan penunjuk lain, ARM adalah sangat rendah. Perbezaan prestasi ini lebih besar daripada perbezaan harga 46% antara A1 dan M5. Dalam erti kata lain, contoh pada pemproses x86 masih mempunyai nisbah harga/prestasi yang lebih baik:

ujian
EC2 A1
EC2 M5d.logam
Perbezaan

cache
1280
311
311,58%

icache
18209
34368
-47,02%

matriks
77932
252190
-69,10%

cpu
9336
24077
-61,22%

memcpy
21085
111877
-81,15%

qsort
522
728
-28,30%

pergigian
1389634
2770985
-49.85%

pemasa
4970125
15367075
-67,66%

Sudah tentu, penanda aras mikro tidak selalu menunjukkan gambaran objektif. Apa yang penting ialah perbezaan dalam prestasi aplikasi sebenar. Tetapi di sini gambar itu ternyata tidak lebih baik. Rakan sekerja dari Scylla membandingkan kejadian a1.metal dan m5.4xlarge dengan bilangan pemproses yang sama. Dalam ujian baca pangkalan data NoSQL standard dalam konfigurasi nod tunggal, yang pertama menunjukkan 102 operasi bacaan sesaat, dan yang kedua 000. Dalam kedua-dua kes, semua pemproses yang tersedia digunakan pada 610%. Ini bersamaan dengan kira-kira pengurangan enam kali ganda dalam prestasi, yang tidak diimbangi oleh harga yang lebih rendah.

Selain itu, kejadian A1 hanya berjalan pada EBS tanpa sokongan untuk peranti NVMe pantas seperti kejadian lain.

Secara keseluruhannya, A1 adalah satu langkah ke arah baharu, tetapi ia tidak memenuhi jangkaan ARM.

Kedatangan Kedua ARM: EC2 M6 Instances

Adakah era pelayan ARM akan datang?

Itu semua berubah minggu ini apabila AWS memperkenalkan kelas pelayan ARM baharu, serta beberapa kejadian pada pemproses baharu Graviton2Termasuk M6g dan M6gd.

Membandingkan keadaan ini menunjukkan gambaran yang sama sekali berbeza. Dalam sesetengah ujian, ARM berprestasi lebih baik, dan kadangkala jauh lebih baik, daripada x86.

Berikut ialah keputusan menjalankan perintah ujian tekanan yang sama:

ujian
EC2 M6g
EC2 M5d.logam
Perbezaan

cache
218
311
-29,90%

icache
45887
34368
33,52%

matriks
453982
252190
80,02%

cpu
14694
24077
-38,97%

memcpy
134711
111877
20,53%

qsort
943
728
29,53%

pergigian
3088242
2770985
11,45%

pemasa
55515663
15367075
261,26%

Ini adalah perkara yang sama sekali berbeza: M6g adalah lima kali lebih pantas daripada A1 apabila melaksanakan operasi baca daripada pangkalan data Scylla NoSQL, dan kejadian M6gd baharu menjalankan pemacu NVMe dengan pantas.

Serangan ARM di semua bahagian

Pemproses AWS Graviton2 hanyalah satu contoh ARM yang digunakan dalam pusat data. Tetapi isyarat datang dari arah yang berbeza. Sebagai contoh, pada 15 November 2019, syarikat permulaan Amerika Nuvia mengumpul $53 juta dalam pembiayaan teroka.

Permulaan itu diasaskan oleh tiga jurutera terkemuka yang terlibat dalam penciptaan pemproses di Apple dan Google. Mereka berjanji untuk membangunkan pemproses untuk pusat data yang akan bersaing dengan Intel dan AMD.

Pada maklumat yang ada, Nuvia telah mereka bentuk teras pemproses dari bawah ke atas yang boleh dibina "di atas" seni bina ARM, tetapi tanpa mendapatkan lesen ARM.

Semua ini menunjukkan bahawa pemproses ARM bersedia untuk menakluki pasaran pelayan. Lagipun, kita hidup dalam era pasca PC. Penghantaran x86 tahunan telah jatuh hampir 10% sejak kemuncaknya pada 2011, manakala cip RISC telah melonjak kepada 20 bilion. Hari ini, 99% daripada pemproses 32- dan 64-bit dunia ialah RISC.

Pemenang Anugerah Turing John Hennessy dan David Patterson menerbitkan artikel pada Februari 2019 "Zaman Keemasan Baru untuk Seni Bina Komputer". Inilah yang mereka tulis:

Pasaran telah menyelesaikan pertikaian RISC-CISC. Walaupun CISC memenangi peringkat akhir era PC, tetapi RISC menang sekarang apabila era pasca PC telah tiba. Tiada ISA CISC baharu telah dicipta selama beberapa dekad. Yang mengejutkan kami, konsensus mengenai prinsip ISA terbaik untuk pemproses tujuan umum hari ini masih memihak kepada RISC, 35 tahun selepas penciptaannya... Dalam ekosistem sumber terbuka, cip yang direka dengan baik akan menunjukkan kemajuan yang menarik dan dengan itu mempercepatkan penggunaan komersial . Falsafah pemproses tujuan umum dalam cip ini mungkin RISC, yang telah bertahan dalam ujian masa. Jangkakan inovasi pesat yang sama seperti semasa zaman keemasan yang lalu, tetapi kali ini dari segi kos, tenaga dan keselamatan, bukan hanya prestasi.

"Dekad yang akan datang akan menyaksikan letupan Cambrian seni bina komputer baru, menandakan masa yang menarik untuk arkitek komputer dalam akademik dan industri, " mereka menyimpulkan kertas itu.

Sumber: www.habr.com

Tambah komen