Kỷ nguyên của máy chủ ARM sắp đến?

Kỷ nguyên của máy chủ ARM sắp đến?
Bo mạch chủ SynQuacer E-Series dành cho máy chủ ARM 24 nhân trên bộ xử lý ARM Cortex A53 với RAM 32 GB, Tháng 2018 năm XNUMX

Trong nhiều năm, bộ xử lý tập lệnh rút gọn (RISC) ARM đã thống trị thị trường thiết bị di động. Nhưng họ chưa bao giờ đột nhập được vào các trung tâm dữ liệu, nơi Intel và AMD vẫn thống trị với tập lệnh x86. Thỉnh thoảng, các giải pháp kỳ lạ riêng lẻ xuất hiện, chẳng hạn như Máy chủ ARM 24 nhân trên nền tảng Banana Pi, nhưng vẫn chưa có đề xuất nghiêm túc nào. Chính xác hơn là phải đến tuần này.

AWS đã ra mắt bộ xử lý ARM 64 lõi của riêng mình trên đám mây trong tuần này trọng lực2 là một hệ thống trên chip có lõi ARM Neoverse N1. Công ty tuyên bố rằng Graviton2 nhanh hơn nhiều so với bộ xử lý ARM thế hệ trước trong các phiên bản EC2 A1 và đây là kết quả thử nghiệm độc lập đầu tiên.

Kinh doanh cơ sở hạ tầng chủ yếu xoay quanh việc so sánh các con số. Trên thực tế, khách hàng của trung tâm dữ liệu hoặc dịch vụ đám mây không quan tâm bộ xử lý có kiến ​​trúc gì. Họ quan tâm đến tỷ lệ giá/hiệu suất. Nếu chạy trên ARM rẻ hơn chạy trên x86 thì chúng sẽ được chọn.

Cho đến gần đây, không thể nói rõ ràng rằng tính toán trên ARM sẽ mang lại nhiều lợi nhuận hơn trên x86. Ví dụ: máy chủ ARM Cortex A24 53 nhân là một mẫu SocioNext SC2A11 có giá khoảng 1000 USD, có thể chạy máy chủ web trên Ubuntu nhưng hiệu năng kém hơn nhiều so với bộ xử lý x86.

Tuy nhiên, hiệu quả sử dụng năng lượng đáng kinh ngạc của bộ xử lý ARM khiến chúng ta phải xem đi xem lại chúng. Ví dụ: SocioNext SC2A11 chỉ tiêu thụ 5 W. Nhưng điện chiếm gần 20% chi phí của trung tâm dữ liệu. Nếu những con chip này thể hiện hiệu năng khá thì x86 sẽ không có cơ hội.

Sự ra đời đầu tiên của ARM: Phiên bản EC2 A1

Cuối năm 2018, AWS đã giới thiệu Phiên bản EC2 A1 trên bộ xử lý ARM của chúng tôi. Đây chắc chắn là một tín hiệu cho ngành về những thay đổi tiềm ẩn trên thị trường, nhưng kết quả điểm chuẩn thật đáng thất vọng.

Bảng dưới đây cho thấy kết quả kiểm tra căng thẳng Phiên bản EC2 A1 (ARM) và EC2 M5d.metal (x86). Tiện ích đã được sử dụng để thử nghiệm stress-ng:

stress-ng --metrics-brief --cache 16 --icache 16 --matrix 16 --cpu 16 --memcpy 16 --qsort 16 --dentry 16 --timer 16 -t 1m

Như bạn có thể thấy, A1 hoạt động kém hơn trong tất cả các thử nghiệm ngoại trừ bộ đệm. Ở hầu hết các chỉ số khác, ARM đều rất kém cỏi. Sự chênh lệch hiệu suất này lớn hơn mức chênh lệch giá 46% giữa A1 và M5. Nói cách khác, các phiên bản trên bộ xử lý x86 vẫn có tỷ lệ giá/hiệu năng tốt hơn:

Thử nghiệm
EC2 A1
EC2 M5d.metal
Khác biệt

bộ nhớ cache
1280
311
311,58%

icache
18209
34368
-47,02%

ma trận
77932
252190
-69,10%

cpu
9336
24077
-61,22%

memcpy
21085
111877
-81,15%

qsort
522
728
-28,30%

răng giả
1389634
2770985
-49.85%

bộ đếm thời gian
4970125
15367075
-67,66%

Tất nhiên, các điểm chuẩn vi mô không phải lúc nào cũng cho thấy một bức tranh khách quan. Điều quan trọng là sự khác biệt trong hiệu suất ứng dụng thực tế. Nhưng ở đây hình ảnh hóa ra cũng không khá hơn. Các đồng nghiệp từ Scylla đã so sánh các phiên bản a1.metal và m5.4xlarge có cùng số lượng bộ xử lý. Trong thử nghiệm đọc cơ sở dữ liệu NoSQL tiêu chuẩn ở một cấu hình nút đơn, thử nghiệm đầu tiên cho thấy 102 thao tác đọc mỗi giây và thử nghiệm thứ hai là 000. Trong cả hai trường hợp, tất cả các bộ xử lý có sẵn đều được sử dụng ở mức 610%. Điều này tương đương với việc giảm hiệu suất khoảng sáu lần, điều này không được bù đắp bằng mức giá thấp hơn.

Ngoài ra, phiên bản A1 chỉ chạy trên EBS mà không hỗ trợ các thiết bị NVMe tốc độ nhanh như các phiên bản khác.

Nhìn chung, A1 là một bước đi theo hướng mới nhưng nó không đáp ứng được kỳ vọng của ARM.

Sự xuất hiện lần thứ hai của ARM: Phiên bản EC2 M6

Kỷ nguyên của máy chủ ARM sắp đến?

Tất cả đã thay đổi trong tuần này khi AWS giới thiệu một loại máy chủ ARM mới cũng như một số phiên bản trên bộ xử lý mới trọng lực2Bao gồm M6g và M6gd.

So sánh những trường hợp này cho thấy một bức tranh hoàn toàn khác. Trong một số thử nghiệm, ARM hoạt động tốt hơn và đôi khi tốt hơn nhiều so với x86.

Dưới đây là kết quả khi chạy lệnh kiểm tra sức chịu đựng tương tự:

Thử nghiệm
EC2 M6g
EC2 M5d.metal
Khác biệt

bộ nhớ cache
218
311
-29,90%

icache
45887
34368
33,52%

ma trận
453982
252190
80,02%

cpu
14694
24077
-38,97%

memcpy
134711
111877
20,53%

qsort
943
728
29,53%

răng giả
3088242
2770985
11,45%

bộ đếm thời gian
55515663
15367075
261,26%

Đây là một vấn đề hoàn toàn khác: M6g nhanh hơn 1 lần so với A6 khi thực hiện các thao tác đọc từ cơ sở dữ liệu Scylla NoSQL và các phiên bản MXNUMXgd mới chạy ổ NVMe nhanh.

ARM tấn công trên mọi mặt trận

Bộ xử lý AWS Graviton2 chỉ là một ví dụ về việc ARM được sử dụng trong các trung tâm dữ liệu. Nhưng các tín hiệu đến từ các hướng khác nhau. Ví dụ: vào ngày 15 tháng 2019 năm XNUMX, công ty khởi nghiệp Nuvia của Mỹ thu hút được 53 triệu USD vốn đầu tư mạo hiểm.

Công ty khởi nghiệp được thành lập bởi ba kỹ sư hàng đầu từng tham gia vào việc tạo ra bộ xử lý tại Apple và Google. Họ hứa sẽ phát triển bộ xử lý cho các trung tâm dữ liệu để cạnh tranh với Intel và AMD.

Trên thông tin có sẵnNuvia đã thiết kế lõi bộ xử lý ngay từ đầu để có thể xây dựng trên kiến ​​trúc ARM nhưng không cần có giấy phép ARM.

Tất cả điều này cho thấy bộ xử lý ARM đã sẵn sàng chinh phục thị trường máy chủ. Suy cho cùng, chúng ta đang sống trong thời đại hậu PC. Các lô hàng x86 hàng năm đã giảm gần 10% kể từ mức đỉnh điểm năm 2011, trong khi số lượng chip RISC đã tăng vọt lên 20 tỷ. Ngày nay, 99% bộ xử lý 32 và 64 bit trên thế giới là RISC.

Những người đoạt giải Turing John Hennessy và David Patterson đã xuất bản một bài báo vào tháng 2019 năm XNUMX “Thời đại hoàng kim mới cho kiến ​​trúc máy tính”. Đây là những gì họ viết:

Thị trường đã giải quyết xong tranh chấp RISC-CISC. Mặc dù CISC đã giành chiến thắng trong giai đoạn sau của kỷ nguyên PC, nhưng RISC hiện đang chiến thắng khi kỷ nguyên hậu PC đã đến. Không có ISA CISC mới nào được tạo ra trong nhiều thập kỷ. Thật ngạc nhiên, sự đồng thuận về các nguyên tắc ISA tốt nhất cho các bộ xử lý đa năng ngày nay vẫn nghiêng về RISC, 35 năm sau khi nó được phát minh... Trong hệ sinh thái nguồn mở, các chip được thiết kế tốt sẽ thể hiện những tiến bộ hấp dẫn và do đó đẩy nhanh việc áp dụng thương mại . Triết lý của bộ xử lý đa năng trong những con chip này có thể sẽ là RISC, đã đứng vững trước thử thách của thời gian. Mong đợi sự đổi mới nhanh chóng giống như trong thời kỳ hoàng kim vừa qua, nhưng lần này về mặt chi phí, năng lượng và an toàn, không chỉ về hiệu suất.

Họ kết luận bài báo: “Thập kỷ tiếp theo sẽ chứng kiến ​​sự bùng nổ của các kiến ​​trúc máy tính mới trong kỷ Cambri, báo hiệu thời kỳ thú vị cho các kiến ​​trúc sư máy tính trong giới học thuật và công nghiệp”.

Nguồn: www.habr.com

Thêm một lời nhận xét