Huawei Dorado V6: Nhiệt đới Tứ Xuyên

Huawei Dorado V6: Nhiệt đới Tứ Xuyên
Thành thật mà nói, mùa hè ở Moscow năm nay không được tốt lắm. Nó bắt đầu quá sớm và nhanh chóng, không phải ai cũng kịp phản ứng và nó đã kết thúc vào cuối tháng 34. Vì vậy, khi Huawei mời tôi đến Trung Quốc, tới thành phố Thành Đô, nơi đặt trung tâm RnD của họ, sau khi xem dự báo thời tiết +6 độ trong bóng râm, tôi đã đồng ý ngay lập tức. Suy cho cùng, tôi không còn bằng tuổi nhau nữa và tôi cần phải làm ấm xương cốt của mình một chút. Nhưng tôi muốn lưu ý rằng có thể làm ấm không chỉ xương mà còn cả bên trong, bởi vì tỉnh Tứ Xuyên, nơi thực sự tọa lạc, nổi tiếng với tình yêu đồ ăn cay. Tuy nhiên, đây không phải là một blog về du lịch, vì vậy hãy quay lại mục tiêu chính của chuyến đi của chúng ta - một dòng hệ thống lưu trữ mới - Huawei Dorado VXNUMX. Bài viết này sẽ gợi lại cho bạn một chút gì đó về quá khứ, bởi vì... nó được viết trước khi có thông báo chính thức, nhưng chỉ được xuất bản sau khi phát hành. Và vì vậy, hôm nay chúng ta sẽ xem xét kỹ hơn mọi thứ thú vị và hấp dẫn mà Huawei đã chuẩn bị cho chúng ta.

Huawei Dorado V6: Nhiệt đới Tứ Xuyên
Sẽ có 5 mẫu trong dòng sản phẩm mới. Tất cả các mẫu ngoại trừ 3000V6 đều có hai phiên bản - SAS và NVMe. Lựa chọn sẽ xác định giao diện của các ổ đĩa mà bạn có thể sử dụng trong hệ thống này, các cổng Back-End và số lượng ổ đĩa mà bạn có thể cài đặt trong hệ thống. Đối với NVMe, SSD cỡ Palm được sử dụng, loại này mỏng hơn SSD 2.5" SAS cổ điển và có thể lắp thành tối đa 36 miếng. Dòng mới là All Flash và không có cấu hình nào bằng đĩa.

Huawei Dorado V6: Nhiệt đới Tứ Xuyên
SSD NVMe của Palm

Theo tôi, Dorado 8000 và 18000 trông có vẻ thú vị nhất, Huawei định vị chúng là hệ thống Cao cấp và nhờ chính sách giá của Huawei, nó tạo ra sự tương phản giữa các mẫu máy tầm trung này với phân khúc đối thủ. Chính những mô hình này mà tôi sẽ tập trung vào trong bài đánh giá của mình ngày hôm nay. Tôi sẽ lưu ý ngay rằng do đặc điểm thiết kế của chúng, hệ thống điều khiển kép cấp dưới có kiến ​​trúc hơi khác, khác với Dorado 8000 và 18000, vì vậy không phải mọi thứ tôi nói hôm nay đều có thể áp dụng cho các mẫu cấp dưới.

Một trong những tính năng chính của hệ thống mới là sử dụng một số chip được phát triển nội bộ, mỗi chip cho phép bạn phân phối tải logic từ bộ xử lý trung tâm của bộ điều khiển và thêm chức năng cho các thành phần khác nhau.
Huawei Dorado V6: Nhiệt đới Tứ Xuyên

Trái tim của hệ thống mới là bộ xử lý Kunpeng 920, được phát triển trên công nghệ ARM và do Huawei sản xuất độc lập. Tùy thuộc vào kiểu máy, số lượng lõi, tần số của chúng và số lượng bộ xử lý được cài đặt trong mỗi bộ điều khiển khác nhau:
Huawei Dorado V6 8000 – 2CPU, 64 nhân
Huawei Dorado V6 18000 – 4CPU, 48 nhân
Huawei Dorado V6: Nhiệt đới Tứ Xuyên

Huawei đã phát triển bộ xử lý này trên kiến ​​​​trúc ARM và theo như tôi biết, ban đầu dự định chỉ cài đặt nó trên các mẫu Dorado 8000 và 18000 cũ hơn, giống như trường hợp của một số mẫu V5, nhưng các biện pháp trừng phạt đã khiến ý tưởng này phải điều chỉnh. Tất nhiên, ARM cũng nói về việc từ chối hợp tác với Huawei trong quá trình áp dụng lệnh trừng phạt, nhưng ở đây tình hình lại khác với Intel. Huawei sản xuất những con chip này một cách độc lập và không có lệnh trừng phạt nào có thể ngăn chặn quá trình này. Việc cắt đứt quan hệ với ARM chỉ đe dọa mất khả năng tiếp cận những phát triển mới. Về hiệu suất, chỉ có thể đánh giá sau khi tiến hành các bài kiểm tra độc lập. Mặc dù tôi đã thấy cách 18000M IOPS được loại bỏ khỏi hệ thống Dorado 1 mà không gặp vấn đề gì, nhưng cho đến khi tôi tự tay lặp lại nó trong giá của mình, tôi sẽ không tin vào điều đó. Nhưng thực sự có rất nhiều quyền lực trong bộ điều khiển. Các mẫu cũ hơn được trang bị 4 bộ điều khiển, mỗi bộ điều khiển có 4 bộ xử lý, tạo ra tổng cộng 768 lõi.
Huawei Dorado V6: Nhiệt đới Tứ Xuyên

Nhưng tôi sẽ nói về lõi sau, khi chúng ta xem xét kiến ​​​​trúc của các hệ thống mới, nhưng bây giờ chúng ta hãy quay lại với một con chip khác được cài đặt trong hệ thống. Con chip trông giống như một giải pháp cực kỳ thú vị Tăng 310 (Theo tôi hiểu thì đó là em trai của Ascend 910, mới được ra mắt công chúng gần đây). Nhiệm vụ của nó là phân tích các khối dữ liệu đưa vào hệ thống để tăng tỷ lệ Read hit. Thật khó để nói nó sẽ hoạt động như thế nào tại nơi làm việc, bởi vì... Ngày nay nó chỉ hoạt động theo một khuôn mẫu nhất định và không có khả năng học ở chế độ thông minh. Sự xuất hiện của chế độ thông minh được hứa hẹn sẽ xuất hiện trong phần sụn trong tương lai, rất có thể là vào đầu năm tới.

Hãy chuyển sang kiến ​​trúc. Huawei đã tiếp tục phát triển công nghệ Smart Matrix của riêng mình, áp dụng phương pháp tiếp cận dạng lưới hoàn chỉnh để kết nối các bộ phận. Nhưng nếu ở V5 điều này chỉ dành cho quyền truy cập từ bộ điều khiển vào đĩa thì giờ đây tất cả các bộ điều khiển đều có quyền truy cập vào tất cả các cổng trên cả Back-End và Front-End.
Huawei Dorado V6: Nhiệt đới Tứ Xuyên

Nhờ kiến ​​trúc microservice mới, điều này cũng cho phép cân bằng tải giữa tất cả các bộ điều khiển, ngay cả khi chỉ có một lun. Hệ điều hành cho dòng mảng này được phát triển từ đầu chứ không chỉ được tối ưu hóa cho việc sử dụng ổ Flash. Do thực tế là tất cả các bộ điều khiển của chúng tôi đều có quyền truy cập vào cùng một cổng, nên trong trường hợp bộ điều khiển bị lỗi hoặc khởi động lại, máy chủ sẽ không mất một đường dẫn nào đến hệ thống lưu trữ và việc chuyển đổi đường dẫn được thực hiện ở cấp hệ thống lưu trữ. Tuy nhiên, việc sử dụng UltraPath trên máy chủ là không thực sự cần thiết. Một cách “tiết kiệm” khác khi cài đặt hệ thống là số lượng liên kết cần thiết ít hơn. Và nếu với cách tiếp cận “cổ điển” đối với 4 bộ điều khiển, chúng ta sẽ cần 8 liên kết từ 2 nhà máy, thì trong trường hợp của Huawei, thậm chí 2 liên kết cũng là đủ (Bây giờ tôi không nói về khả năng cung cấp thông lượng của một liên kết).
Huawei Dorado V6: Nhiệt đới Tứ Xuyên

Như trong phiên bản trước, bộ đệm chung có tính năng phản chiếu được sử dụng. Điều này cho phép bạn mất tối đa hai bộ điều khiển cùng lúc hoặc ba bộ điều khiển tuần tự mà không ảnh hưởng đến tính khả dụng. Nhưng điều đáng chú ý là chúng tôi không thấy cân bằng tải hoàn toàn giữa 3 bộ điều khiển còn lại trong trường hợp xảy ra một lỗi ở quầy demo. Tải của bộ điều khiển bị lỗi đã được đảm nhận hoàn toàn bởi một trong những bộ điều khiển còn lại. Có thể để làm được điều này, cần phải để hệ thống hoạt động lâu hơn trong cấu hình này. Trong mọi trường hợp, tôi sẽ kiểm tra điều này chi tiết hơn bằng các thử nghiệm của riêng tôi.
Huawei đang định vị các hệ thống mới là hệ thống NVMe đầu cuối, nhưng ngày nay NVMeOF vẫn chưa được hỗ trợ ở mặt trước, chỉ có FC, iSCSI hoặc NFS. Vào cuối tính năng này hoặc đầu tính năng tiếp theo, giống như các tính năng khác, chúng tôi được hứa sẽ hỗ trợ RoCE.
Huawei Dorado V6: Nhiệt đới Tứ Xuyên

Các kệ cũng được kết nối với bộ điều khiển bằng RoCE và có một nhược điểm liên quan đến điều này - thiếu kết nối “loopback” của các kệ, như trường hợp của SAS. Theo tôi, đây vẫn là một nhược điểm khá lớn nếu bạn đang lên kế hoạch cho một hệ thống khá lớn. Thực tế là tất cả các kệ đều được kết nối nối tiếp và việc một trong các kệ bị hỏng sẽ dẫn đến việc tất cả các kệ khác theo sau nó hoàn toàn không thể tiếp cận được. Trong trường hợp này, để đảm bảo khả năng chịu lỗi, chúng tôi sẽ phải kết nối tất cả các kệ với bộ điều khiển, điều này đòi hỏi phải tăng số lượng cổng phụ trợ cần thiết trong hệ thống.

Và một điều đáng nói nữa là cập nhật không gián đoạn (NDU). Như tôi đã nói ở trên, Huawei đã triển khai phương pháp tiếp cận container để vận hành HĐH cho dòng Dorado mới, điều này cho phép bạn cập nhật và khởi động lại dịch vụ mà không cần phải khởi động lại hoàn toàn bộ điều khiển. Điều đáng nói ngay là một số bản cập nhật sẽ chứa các bản cập nhật kernel và trong trường hợp này, đôi khi vẫn cần khởi động lại bộ điều khiển cổ điển trong quá trình cập nhật, nhưng không phải lúc nào cũng vậy. Điều này sẽ làm giảm tác động của hoạt động này lên hệ thống sản xuất.

Trong kho vũ khí của chúng tôi, phần lớn các mảng đều đến từ NetApp. Vì vậy, tôi nghĩ sẽ khá logic nếu làm một so sánh nhỏ với các hệ thống mà tôi phải làm việc khá nhiều. Đây không phải là nỗ lực để xác định xem ai tốt hơn và ai kém hơn hay kiến ​​trúc của ai có lợi hơn. Tôi sẽ cố gắng so sánh một cách tỉnh táo và không cuồng nhiệt hai cách tiếp cận khác nhau để giải quyết cùng một vấn đề từ các nhà cung cấp khác nhau. Có, tất nhiên, trong trường hợp này, chúng tôi sẽ xem xét các hệ thống Huawei về “lý thuyết” và tôi cũng sẽ lưu ý riêng những điểm dự định triển khai trong các phiên bản phần sụn trong tương lai. Tôi thấy những lợi thế nào vào lúc này:

  1. Số lượng ổ NVMe được hỗ trợ. NetApp hiện có 288 trong số đó, trong khi Huawei có 1600-6400, tùy thuộc vào kiểu máy. Đồng thời, dung lượng sử dụng Max của Huawei là 32PBe, giống như các hệ thống NetApp (nói chính xác hơn là chúng có 31.64PBe). Và điều này mặc dù thực tế là các ổ đĩa có cùng âm lượng đều được hỗ trợ (lên đến 15Tb). Huawei giải thích sự thật này như sau: họ không có cơ hội lắp ráp một giá đỡ lớn hơn. Về lý thuyết, họ không có giới hạn về âm lượng, nhưng đơn giản là họ chưa thể kiểm tra thực tế này. Nhưng ở đây cần lưu ý rằng khả năng của ổ đĩa flash ngày nay rất cao và trong trường hợp hệ thống NVMe, chúng ta phải đối mặt với thực tế là 24 ổ là đủ để sử dụng hệ thống 2 bộ điều khiển cao cấp nhất. Theo đó, việc tăng thêm số lượng đĩa trong hệ thống không những không giúp tăng hiệu suất mà còn có tác động xấu đến tỷ lệ IOPS/Tb. Tất nhiên, cần xem hệ thống 4 bộ điều khiển 8000 và 16000 có thể xử lý được bao nhiêu ổ đĩa, bởi vì... Khả năng và tiềm năng của Kunpeng 920 vẫn chưa hoàn toàn rõ ràng.
  2. Sự góp mặt của Lun với tư cách là chủ sở hữu hệ thống NetApp. Những thứ kia. Chỉ một bộ điều khiển có thể thực hiện các thao tác với mặt trăng, trong khi bộ điều khiển thứ hai chỉ truyền IO qua chính nó. Ngược lại, các hệ thống Huawei không có bất kỳ chủ sở hữu nào và các hoạt động với khối dữ liệu (nén, chống trùng lặp) có thể được thực hiện bởi bất kỳ bộ điều khiển nào, cũng như được ghi vào đĩa.
  3. Không có cổng nào bị rớt khi một trong các bộ điều khiển bị lỗi. Đối với một số người, thời điểm này có vẻ cực kỳ quan trọng. Điểm mấu chốt là việc chuyển đổi bên trong hệ thống lưu trữ sẽ diễn ra nhanh hơn so với phía máy chủ. Và nếu trong trường hợp của cùng một NetApp, trong thực tế, chúng tôi thấy bị treo khoảng 5 giây khi rút bộ điều khiển ra và chuyển đường dẫn, thì khi chuyển sang Huawei, chúng tôi vẫn phải thực hành.
  4. Không cần phải khởi động lại bộ điều khiển khi cập nhật. Điều này đặc biệt khiến tôi lo lắng khi phát hành khá thường xuyên các phiên bản và nhánh chương trình cơ sở mới cho NetApps. Có, một số bản cập nhật cho Huawei vẫn sẽ yêu cầu khởi động lại, nhưng không phải tất cả.
  5. 4 bộ điều khiển Huawei với giá bằng hai bộ điều khiển NetApp. Như mình đã nói ở trên, nhờ chính sách giá của Huawei nên hãng có thể cạnh tranh được với phân khúc tầm trung bằng các dòng cao cấp của mình.
  6. Sự hiện diện của các chip bổ sung trong bộ điều khiển kệ và thẻ cổng, có khả năng nhằm cải thiện hiệu quả hệ thống.

Nhược điểm và mối quan tâm nói chung:

  1. Kết nối trực tiếp các kệ với bộ điều khiển hoặc cần một số lượng lớn cổng phụ để kết nối tất cả các kệ với bộ điều khiển.
  2. Kiến trúc ARM và sự hiện diện của một số lượng lớn chip - nó sẽ hoạt động hiệu quả như thế nào và hiệu suất có đủ không?

Hầu hết những lo lắng và sợ hãi có thể được xua tan bằng cách cá nhân thử nghiệm dòng sản phẩm mới. Tôi hy vọng rằng ngay sau khi phát hành, chúng sẽ xuất hiện ở Moscow và sẽ có đủ chúng để bạn nhanh chóng có được một chiếc cho các cuộc thử nghiệm của riêng mình. Cho đến nay, chúng ta có thể nói rằng nhìn chung cách tiếp cận của công ty có vẻ thú vị và dòng sản phẩm mới trông rất tốt so với các đối thủ cạnh tranh. Việc thực hiện cuối cùng đặt ra rất nhiều câu hỏi, bởi vì Chúng ta sẽ chỉ thấy nhiều điều vào cuối năm và có thể chỉ trong năm 2020.

Nguồn: www.habr.com

Thêm một lời nhận xét