Chúng tôi chia sẻ kinh nghiệm của mình, cách SSD hoạt động trong khuôn khổ RAID và cấp mảng nào có lợi hơn

В vật liệu quá khứ chúng tôi đã xem xét câu hỏi “Liệu chúng tôi có áp dụng RAID trên SSD hay không” bằng cách sử dụng ví dụ về ổ đĩa Kingston, nhưng chúng tôi chỉ làm điều đó ở cấp độ không. Trong bài viết hiện tại, chúng tôi sẽ phân tích các tùy chọn sử dụng giải pháp NVMe chuyên nghiệp và gia đình trong các loại mảng RAID phổ biến nhất và nói về khả năng tương thích của bộ điều khiển. Broadcom với ổ đĩa Kingston.

Chúng tôi chia sẻ kinh nghiệm của mình, cách SSD hoạt động trong khuôn khổ RAID và cấp mảng nào có lợi hơn

Tại sao bạn cần RAID trên SSD?

Ưu điểm của mảng lưu trữ dựa trên SSD so với mảng lưu trữ HDD bao gồm thời gian truy cập dữ liệu trên ổ đĩa nhanh hơn và hiệu suất đọc/ghi vượt trội. Tuy nhiên, hiệu suất RAID lý tưởng dựa trên SSD yêu cầu sự kết hợp tối ưu giữa bộ xử lý, bộ nhớ đệm, phần mềm và phần cứng. Khi tất cả các yếu tố này kết hợp với nhau một cách hoàn hảo, RAID SSD có thể vượt trội hơn rất nhiều so với cấu hình tương đương sử dụng ổ cứng truyền thống.

Một SSD điển hình tiêu thụ ít điện năng hơn so với HDD, vì vậy khi bạn kết hợp một số lượng lớn SSD trong một mảng RAID, mức tiết kiệm năng lượng so với một mảng RAID HDD cũng có thể chuyển thành chi phí hóa đơn năng lượng của công ty thấp hơn.

Tuy nhiên, SSD RAID có những hạn chế và nhược điểm, cụ thể là giá cao hơn trên mỗi gigabyte dung lượng so với ổ cứng có dung lượng tương đương. Và thời gian giữa các lỗi bộ nhớ flash bị giới hạn trong một số chu kỳ ghi lại nhất định. Nghĩa là, ổ SSD có tuổi thọ sử dụng nhất định, điều này phụ thuộc vào hoạt động: càng nhiều thông tin được ghi đè lên ổ, ổ sẽ hỏng càng nhanh. Mặt khác, SSD dành cho doanh nghiệp có tuổi thọ tương đương với ổ cứng cơ học.

Cách SSD Kingston hoạt động ở chế độ RAID với bộ điều khiển Broadcom

Trong những ngày đầu của SSD, thiết kế RAID có nhiều sắc thái. Kể cả do sử dụng ổ cứng ít lỗi hơn. Ổ đĩa trạng thái rắn đáng tin cậy hơn nhiều so với các đối tác của chúng dựa trên đĩa từ. Như chúng ta đã biết, không có bộ phận chuyển động nào trong các giải pháp SSD, vì vậy hư hỏng cơ học được giảm xuống bằng không. Việc ổ đĩa thể rắn bị hỏng do tăng điện áp cũng khó xảy ra, do ở cấp độ PC gia đình và bất kỳ máy chủ nào, UPS, bộ chống sét lan truyền và thậm chí cả nguồn điện đều bảo vệ bạn.

Đồng thời, ổ cứng thể rắn có một điểm cộng đáng kể khác: ngay cả khi các ô nhớ bị hao mòn để ghi, dữ liệu vẫn có thể được đọc từ chúng, nhưng nếu đĩa từ bị hỏng thì than ôi.

Chúng tôi chia sẻ kinh nghiệm của mình, cách SSD hoạt động trong khuôn khổ RAID và cấp mảng nào có lợi hơn

Ngày nay, việc sử dụng các giải pháp SSD trong các mảng RAID ở các cấp độ khác nhau là điều khá bình thường. Điều chính là chọn ổ SSD phù hợp, độ trễ của nó là tối thiểu. Và lý tưởng nhất là sử dụng ổ SSD từ cùng một nhà sản xuất và cùng một kiểu máy để bạn không kết thúc với một loạt các ổ đĩa hỗ trợ các loại tải khác nhau và được xây dựng trên cơ sở các loại bộ nhớ, bộ điều khiển và các công nghệ khác. Nghĩa là, nếu chúng tôi quyết định mua bốn hoặc 16 ổ SSD NVMe từ Kingston để tạo một mảng RAID, thì sẽ tốt hơn nếu tất cả chúng đều thuộc cùng một dòng và kiểu máy.

Nhân tiện, trong bài viết cuối cùng chúng tôi đã viện dẫn lý do cho bộ điều khiển Broadcom khi nói về SSD NVMe của Kingston. Thực tế là hướng dẫn sử dụng cho các thiết bị này ngay lập tức quy định các ổ đĩa tương thích (bao gồm cả các giải pháp từ nhà sản xuất SSD của Mỹ đã nói ở trên), mà bộ điều khiển sẽ hoạt động hoàn hảo. Thông tin này nên được dựa vào khi chọn gói bộ điều khiển-SSD cho RAID.

Chúng tôi phân tích hoạt động của SSD Kingston trong các loại RAID phổ biến nhất - “1”, “5”, “10”, “50”

Vì vậy, cấp độ RAID "zero" không cung cấp dự phòng dữ liệu mà chỉ tăng hiệu suất. RAID 0 hoàn toàn không cung cấp bất kỳ sự bảo vệ dữ liệu nào, vì vậy chúng tôi sẽ không xem xét nó trong phân khúc doanh nghiệp. Mặt khác, RAID 1 cung cấp khả năng dự phòng đầy đủ nhưng chỉ tăng hiệu suất ở mức khiêm tốn, và do đó nên được xem xét nếu tăng hiệu suất không phải là yếu tố cần cân nhắc chính khi xây dựng mảng RAID SSD.

RAID 1 dựa trên SSD Kingston và bộ điều khiển Broadcom

Vì vậy, mảng RAID cấp độ đầu tiên dựa trên bộ điều khiển Broadcom MegaRAID 9460-16i kết hợp từ hai đến 32 ổ đĩa Kingston, là bản sao của nhau và cung cấp khả năng dự phòng hoàn chỉnh. Nếu khi sử dụng các ổ cứng truyền thống, tốc độ ghi và đọc dữ liệu vẫn ở mức của chính ổ cứng này, thì khi sử dụng các giải pháp SSD NVMe, chúng tôi sẽ tăng hiệu suất gấp 1000 lần. Đặc biệt là về thời gian truy cập dữ liệu. Ví dụ: với hai ổ SSD Kingston DC2M U.1 NVMe trong RAID 350 của máy chủ, chúng tôi nhận được 000 IOPS đọc ngẫu nhiên và 75 IOPS ghi.

Chúng tôi chia sẻ kinh nghiệm của mình, cách SSD hoạt động trong khuôn khổ RAID và cấp mảng nào có lợi hơn

Về tốc độ đọc tuần tự, kết quả sẽ phù hợp với đặc điểm của ổ đĩa - 3200 MB / s. Tuy nhiên, vì cả hai ổ SSD NVMe đều đang hoạt động tốt nên dữ liệu có thể được đọc từ chúng cùng một lúc, điều này khiến cho thao tác đọc diễn ra khá nhanh. Nhưng tốc độ ghi (được tuyên bố là 2000 MB / s) sẽ chậm hơn, vì mỗi thao tác ghi được thực hiện hai lần.

Chúng tôi chia sẻ kinh nghiệm của mình, cách SSD hoạt động trong khuôn khổ RAID và cấp mảng nào có lợi hơn

RAID 1 lý tưởng cho các cơ sở dữ liệu nhỏ hoặc bất kỳ môi trường nào khác yêu cầu khả năng chịu lỗi nhưng dung lượng thấp. Phản chiếu ổ đĩa đặc biệt hữu ích trong các tình huống khắc phục thảm họa (hiệu suất bị suy giảm một chút) vì nó cung cấp khả năng "hồi sinh" dữ liệu quan trọng ngay lập tức nếu một trong các ổ đĩa trong mảng bị lỗi. Nhưng vì mức độ bảo vệ này yêu cầu tăng gấp đôi dung lượng lưu trữ của dữ liệu được nhân đôi (100 TB sẽ yêu cầu 200 TB dung lượng lưu trữ), nhiều hệ thống doanh nghiệp sử dụng các tùy chọn lưu trữ kinh tế hơn: RAID 5 và RAID 6.

RAID 5 dựa trên SSD Kingston và bộ điều khiển Broadcom

Để tổ chức một mảng RAID cấp thứ năm, chúng ta cần ít nhất ba ổ đĩa, dữ liệu trên đó được ghi xen kẽ (ghi theo chu kỳ vào tất cả các ổ đĩa trong mảng), nhưng không được sao chép. Khi tổ chức chúng, người ta nên tính đến cấu trúc phức tạp hơn của chúng, vì ở đây xuất hiện một khái niệm như "tổng kiểm tra" (hoặc "tương đương"). Khái niệm này có nghĩa là hàm XOR đại số logic (còn gọi là "OR" độc quyền), cho phép sử dụng tối thiểu ba ổ đĩa trong mảng (tối đa - 32). Trong trường hợp này, thông tin chẵn lẻ được ghi vào tất cả các "đĩa" trong mảng.

Chúng tôi chia sẻ kinh nghiệm của mình, cách SSD hoạt động trong khuôn khổ RAID và cấp mảng nào có lợi hơn

Đối với dãy bốn ổ SSD Kingston DC500R SATA có dung lượng 3,84 TB mỗi ổ, chúng tôi nhận được 11,52 TB dung lượng và 3,84 cho tổng kiểm tra. Và nếu bạn kết hợp 16 ổ đĩa Kingston DC1000M U.2 NVMe với dung lượng 7,68 TB vào một RAID cấp 115,2, chúng ta sẽ biết được 7,68 TB với mức hao hụt 5 TB. Như bạn có thể thấy, càng nhiều ổ đĩa thì càng tốt. Nó cũng tốt hơn vì càng nhiều ổ đĩa trong RAID 0, hiệu suất ghi tổng thể càng cao. Và đọc tuyến tính sẽ đạt đến mức RAID XNUMX.

Chúng tôi chia sẻ kinh nghiệm của mình, cách SSD hoạt động trong khuôn khổ RAID và cấp mảng nào có lợi hơn

Nhóm đĩa RAID 5 cung cấp thông lượng cao (đặc biệt đối với các tệp lớn) và khả năng dự phòng với tổn thất điện năng tối thiểu. Kiểu tổ chức mảng này phù hợp nhất với các mạng thực hiện nhiều hoạt động nhập/xuất (I/O) nhỏ cùng một lúc. Nhưng bạn không nên sử dụng nó cho các tác vụ yêu cầu số lượng lớn thao tác ghi cho các khối nhỏ hoặc nhỏ.
Có một sắc thái nữa: nếu ít nhất một trong các ổ NVMe bị lỗi, RAID 5 sẽ chuyển sang chế độ xuống cấp và lỗi của một thiết bị lưu trữ khác có thể trở nên nghiêm trọng đối với tất cả dữ liệu. Nếu một ổ đĩa trong mảng bị lỗi, bộ điều khiển RAID sẽ sử dụng thông tin chẵn lẻ để tạo lại bất kỳ dữ liệu bị thiếu nào.

RAID 10 dựa trên SSD Kingston và bộ điều khiển Broadcom

Vì vậy, RAID 0 cung cấp cho chúng tôi tốc độ và thời gian truy cập tăng gấp đôi và RAID 1 cung cấp độ tin cậy. Lý tưởng nhất là chúng sẽ được kết hợp với nhau và ở đây RAID 10 (hoặc 1 + 0) sẽ ra tay giải cứu. "Mười" được lắp ráp từ bốn ổ SSD SATA hoặc NVMe (tối đa - 32) và ngụ ý một mảng "gương", số lượng ổ đĩa trong đó phải luôn là bội số của bốn. Dữ liệu trong mảng này được ghi bằng cách sử dụng phân vùng khối cố định (như trong trường hợp RAID 0) và phân chia giữa các ổ đĩa, trải rộng các bản sao trên các "ổ đĩa" trong một mảng RAID 1. Và với khả năng truy cập nhiều nhóm ổ đĩa cùng một lúc đồng thời, RAID 10 cho thấy hiệu suất cao.

Chúng tôi chia sẻ kinh nghiệm của mình, cách SSD hoạt động trong khuôn khổ RAID và cấp mảng nào có lợi hơn

Vì RAID 10 có khả năng phân tách dữ liệu trên nhiều cặp được nhân bản, điều này có nghĩa là nó có thể chịu đựng được lỗi của một ổ đĩa trong một cặp. Tuy nhiên, nếu cả hai cặp được nhân đôi (tức là cả bốn ổ đĩa) đều bị lỗi, thì việc mất dữ liệu không thể tránh khỏi sẽ xảy ra. Kết quả là, chúng tôi cũng có được khả năng chịu lỗi và độ tin cậy tốt. Nhưng hãy nhớ rằng, giống như RAID 1, mảng cấp mười chỉ sử dụng một nửa tổng dung lượng và do đó là một giải pháp đắt tiền. Và cũng khó thiết lập.

RAID 10 phù hợp để sử dụng với các kho dữ liệu yêu cầu dự phòng 100% cho các nhóm đĩa được nhân bản, cũng như tăng hiệu suất I/O của RAID 0. Đây là giải pháp tốt nhất cho cơ sở dữ liệu cỡ trung bình hoặc bất kỳ môi trường nào yêu cầu khả năng chịu lỗi cao hơn hơn RAID 5.

RAID 50 dựa trên SSD Kingston và bộ điều khiển Broadcom

Một mảng kết hợp tương tự như RAID cấp 5, là mảng cấp 50 được xây dựng từ các mảng cấp 5. Như trước đây, mục tiêu chính của mảng này là đạt được hiệu suất gấp đôi trong khi vẫn duy trì độ tin cậy của dữ liệu trong mảng RAID XNUMX. Đồng thời, RAID XNUMX cung cấp hiệu suất ghi được cải thiện và bảo vệ dữ liệu tốt hơn so với RAID XNUMX tiêu chuẩn trong trường hợp ổ đĩa bị lỗi , và cũng có khả năng phục hồi nhanh hơn trong trường hợp một trong các ổ đĩa bị lỗi.

Chúng tôi chia sẻ kinh nghiệm của mình, cách SSD hoạt động trong khuôn khổ RAID và cấp mảng nào có lợi hơn

Nhóm ổ đĩa RAID 50 chia dữ liệu thành các khối nhỏ hơn và sau đó chia nhỏ dữ liệu trên từng mảng RAID 5. Nhóm ổ đĩa RAID 5 cũng chia dữ liệu thành các khối nhỏ hơn, tính toán chẵn lẻ, thực hiện thao tác OR logic trên các khối, sau đó thực hiện các hoạt động ghi khối dữ liệu và tính chẵn lẻ cho mỗi đĩa trong nhóm đĩa.

Và mặc dù hiệu suất chắc chắn bị suy giảm nếu một trong các ổ đĩa bị lỗi, nhưng nó không đáng kể như trong mảng RAID 5, vì một lỗi chỉ ảnh hưởng đến một trong các mảng, khiến mảng còn lại hoạt động bình thường. Trên thực tế, RAID 50 có thể tồn tại tới tám lỗi ổ HDD/SSD/NVMe nếu mỗi "đĩa" bị lỗi nằm trong một mảng RAID 5 riêng biệt.

Chúng tôi chia sẻ kinh nghiệm của mình, cách SSD hoạt động trong khuôn khổ RAID và cấp mảng nào có lợi hơn

RAID 50 được sử dụng tốt nhất cho các ứng dụng đòi hỏi độ tin cậy cao và phải xử lý số lượng lớn yêu cầu trong khi vẫn duy trì tốc độ truyền dữ liệu cao và chi phí ổ đĩa thấp hơn so với RAID 10. Tuy nhiên, do cần tối thiểu sáu ổ đĩa để thiết lập một mảng RAID 50 , chi phí không được loại trừ hoàn toàn như một yếu tố. Một nhược điểm của RAID 50 là, giống như RAID 5, nó cần một bộ điều khiển phức tạp: chẳng hạn như được đề cập bởi chúng tôi trong bài báo cuối cùng MegaRAID 9460-16i từ BroadCom.

Cũng cần lưu ý rằng RAID 50 sử dụng ít dung lượng đĩa hơn RAID 5 do phân bổ dung lượng để giữ các bản ghi chẵn lẻ. Tuy nhiên, nó vẫn có nhiều không gian sử dụng hơn so với các cấp độ RAID khác, đặc biệt là những cấp độ sử dụng phản chiếu. Với yêu cầu tối thiểu là sáu ổ đĩa, RAID 50 có thể là một lựa chọn tốn kém, nhưng dung lượng ổ đĩa bổ sung sẽ biện minh cho chi phí bằng cách bảo vệ dữ liệu của công ty. Loại mảng này được khuyên dùng cho dữ liệu yêu cầu độ tin cậy lưu trữ cao, tỷ lệ yêu cầu cao, tốc độ truyền cao và dung lượng lưu trữ cao.

RAID 6 và RAID 60: chúng tôi cũng không quên chúng

Vì chúng ta đã nói về các mảng ở cấp độ thứ năm và thứ năm mươi, nên sẽ thật thiếu sót nếu không đề cập đến các kiểu tổ chức mảng như RAID 6 và RAID 60.

Chúng tôi chia sẻ kinh nghiệm của mình, cách SSD hoạt động trong khuôn khổ RAID và cấp mảng nào có lợi hơn

Hiệu suất của RAID 6 tương tự như RAID 5, nhưng ở đây ít nhất hai ổ đĩa được cung cấp tính chẵn lẻ, điều này cho phép mảng tồn tại sau sự cố của hai ổ đĩa mà không làm mất dữ liệu (trong RAID 5, tình huống này rất không mong muốn). Điều này dẫn đến độ tin cậy cao hơn. Mặt khác, mọi thứ đều giống như trong mảng cấp thứ năm: trong trường hợp một hoặc hai đĩa bị lỗi, bộ điều khiển RAID sử dụng các khối chẵn lẻ để tạo lại tất cả thông tin còn thiếu. Nếu hai ổ đĩa bị lỗi, quá trình khôi phục sẽ không diễn ra đồng thời: đầu tiên, ổ đĩa đầu tiên được kích hoạt lại, sau đó là ổ đĩa thứ hai. Do đó, hai hoạt động khôi phục dữ liệu được thực hiện.

Chúng tôi chia sẻ kinh nghiệm của mình, cách SSD hoạt động trong khuôn khổ RAID và cấp mảng nào có lợi hơn

Dễ đoán nếu RAID 50 là mảng cấp 60 của mảng cấp 6 thì RAID 50 là mảng cấp 8 của mảng cấp 16 mà chúng ta vừa nói. Tức là, cách tổ chức lưu trữ RAID này cho phép bạn sống sót sau khi mất hai ổ SSD trong mỗi nhóm ổ RAID XNUMX. Nguyên tắc hoạt động tương tự như nguyên tắc chúng ta đã nói trong phần RAID XNUMX, nhưng số lượng lỗi mà một mảng cấp XNUMX chịu được tăng từ XNUMX lên XNUMX ổ. Thông thường, các mảng như vậy được sử dụng cho dịch vụ khách hàng trực tuyến, yêu cầu khả năng chịu lỗi cao.

Tổng hợp:

Mặc dù phản chiếu cung cấp nhiều khả năng chịu lỗi hơn RAID 50/60, nhưng nó cũng yêu cầu nhiều không gian hơn. Vì lượng dữ liệu được nhân đôi, nên bạn thực sự chỉ nhận được 50% tổng dung lượng của các ổ đĩa được cài đặt trong máy chủ để ghi và lưu trữ thông tin. Lựa chọn giữa RAID 50/60 và RAID 10 rất có thể sẽ phụ thuộc vào ngân sách hiện có, dung lượng máy chủ và nhu cầu bảo vệ dữ liệu của bạn. Hơn nữa, chi phí được đặt lên hàng đầu khi chúng ta nói về các giải pháp SSD (cả cấp doanh nghiệp và người tiêu dùng).

Cũng quan trọng không kém, giờ đây chúng tôi biết chắc chắn rằng RAID dựa trên SSD là một giải pháp hoàn toàn an toàn và là một thông lệ bình thường cho doanh nghiệp ngày nay. Là một phần của việc sử dụng tại nhà, cũng có lý do để chuyển sang NVMe, nếu ngân sách cho phép. Và nếu bạn vẫn còn thắc mắc tại sao lại cần tất cả những thứ này, hãy quay lại phần đầu của bài viết - chúng tôi đã giải đáp chi tiết rồi.

Bài viết này được chuẩn bị với sự hỗ trợ của các đồng nghiệp của chúng tôi tại Broadcom, những người cung cấp bộ điều khiển của họ cho các kỹ sư của Kingston để thử nghiệm với các ổ đĩa SATA/SAS/NVMe cấp doanh nghiệp. Nhờ sự cộng sinh thân thiện này, khách hàng không phải nghi ngờ về độ tin cậy và ổn định của ổ đĩa Kingston với bộ điều khiển HBA và RAID từ quá trình sản xuất. Broadcom.

Bạn có thể tìm thêm thông tin về các sản phẩm của Kingston tại trang web chính thức công ty

Nguồn: www.habr.com

Thêm một lời nhận xét