Chủ đề về khả năng chịu lỗi trong hệ thống lưu trữ dữ liệu luôn có liên quan, vì trong thời đại ảo hóa và hợp nhất tài nguyên rộng rãi của chúng ta, hệ thống lưu trữ là mắt xích mà lỗi sẽ không chỉ dẫn đến một tai nạn thông thường mà còn dẫn đến thời gian ngừng hoạt động lâu dài của dịch vụ. Do đó, các hệ thống lưu trữ hiện đại chứa nhiều thành phần trùng lặp (thậm chí cả bộ điều khiển). Nhưng sự bảo vệ như vậy có đủ không?

Tuyệt đối tất cả các nhà cung cấp, khi liệt kê các đặc điểm của hệ thống lưu trữ, luôn đề cập đến khả năng chịu lỗi cao trong các giải pháp của họ, luôn thêm thuật ngữ “không có một điểm lỗi nào”. Chúng ta hãy xem xét kỹ hơn một hệ thống lưu trữ điển hình. Để tránh thời gian ngừng hoạt động trong quá trình bảo trì, hệ thống lưu trữ sao chép nguồn điện, mô-đun làm mát, cổng đầu vào/đầu ra, ổ đĩa (ý chúng tôi là RAID) và tất nhiên là bộ điều khiển. Nếu bạn nhìn kỹ vào kiến trúc này, bạn sẽ nhận thấy ít nhất hai điểm thất bại tiềm ẩn, được giữ im lặng một cách khiêm tốn:
- Sự sẵn có của một bảng nối đa năng duy nhất
- Có một bản sao của dữ liệu
Bảng nối đa năng là một thiết bị phức tạp về mặt kỹ thuật, phải trải qua quá trình thử nghiệm nghiêm ngặt trong quá trình sản xuất. Và do đó, có những trường hợp cực kỳ hiếm khi nó thất bại hoàn toàn. Tuy nhiên, ngay cả trong trường hợp xảy ra sự cố cục bộ, chẳng hạn như khe cắm ổ đĩa không hoạt động, nó sẽ cần được thay thế bằng việc tắt hoàn toàn hệ thống lưu trữ.
Việc tạo nhiều bản sao dữ liệu thoạt nhìn cũng không phải là vấn đề. Ví dụ: chức năng Sao chép trong hệ thống lưu trữ, cho phép bạn cập nhật bản sao dữ liệu hoàn chỉnh trong một khoảng thời gian, khá phổ biến. Tuy nhiên, trong trường hợp xảy ra sự cố với cùng một bản phát lại, bản sao sẽ không có sẵn như bản gốc.
Một giải pháp hoàn toàn rõ ràng để khắc phục những thiếu sót này là sao chép sang hệ thống lưu trữ khác. Nếu chúng ta nhắm mắt trước việc chi phí phần cứng sẽ tăng gấp đôi dự kiến (chúng ta vẫn cho rằng những người chọn quyết định như vậy đã suy nghĩ thỏa đáng và chấp nhận thực tế này trước), thì vẫn có thể có những chi phí cho việc tổ chức nhân rộng dưới dạng giấy phép, bổ sung phần mềm và phần cứng. Và quan trọng nhất, bạn sẽ cần bằng cách nào đó đảm bảo tính nhất quán của dữ liệu được sao chép. Những thứ kia. xây dựng một bộ ảo hóa lưu trữ/vSAN/v.v., công việc này cũng đòi hỏi nguồn lực về tiền bạc và thời gian.
Khi tạo hệ thống Tính sẵn sàng cao, chúng tôi đặt mục tiêu loại bỏ những thiếu sót nêu trên. Đây là cách giải thích về công nghệ Shared Nothing xuất hiện, được dịch một cách lỏng lẻo có nghĩa là “không sử dụng các thiết bị dùng chung”.
Khái niệm kiến trúc thể hiện việc sử dụng hai nút độc lập (bộ điều khiển), mỗi nút có bộ dữ liệu riêng. Quá trình sao chép đồng bộ xảy ra giữa các nút thông qua giao diện InfiniBand 56G, hoàn toàn minh bạch đối với phần mềm chạy trên hệ thống lưu trữ. Do đó, việc sử dụng các bộ ảo hóa lưu trữ, tác nhân phần mềm, v.v. là không cần thiết.
Về mặt vật lý, giải pháp hai nút từ AccelStor có thể được triển khai theo hai mô hình:
- — dựa trên máy chủ Twin trong trường hợp 2U, nếu yêu cầu hiệu suất vừa phải và dung lượng lên tới 22TB;
- — dựa trên các máy chủ 2U riêng lẻ, nếu yêu cầu hiệu suất cao và dung lượng lớn (lên tới 57TB).

Model H510 dựa trên máy chủ Twin

Model H710 dựa trên các máy chủ riêng lẻ
Việc sử dụng các hệ số dạng khác nhau là do nhu cầu về số lượng ổ SSD khác nhau để đạt được dung lượng và hiệu suất nhất định. Ngoài ra, nền tảng Twin rẻ hơn và cho phép bạn cung cấp các giải pháp hợp lý hơn, mặc dù có một số “bất lợi” có điều kiện dưới dạng một bảng nối đa năng duy nhất. Mọi thứ khác, bao gồm cả nguyên lý hoạt động, đều hoàn toàn giống nhau đối với cả hai mẫu máy.
Tập dữ liệu cho mỗi nút có hai nhóm , cộng thêm 2 phụ tùng nóng. Mỗi nhóm có thể chịu được sự cố của một ổ SSD. Tất cả các yêu cầu đến để ghi lại một nút theo FlexiRemap xây dựng lại các khối 4KB thành các chuỗi tuần tự, sau đó được ghi vào SSD ở chế độ thoải mái nhất cho chúng (ghi tuần tự). Hơn nữa, máy chủ chỉ nhận được xác nhận ghi sau khi dữ liệu được đặt vật lý trên SSD, tức là. không có bộ nhớ đệm trong RAM. Kết quả là hiệu suất rất ấn tượng với tốc độ ghi lên tới 600K IOPS và đọc hơn 1M IOPS (model H710).
Như đã đề cập trước đó, các bộ dữ liệu được đồng bộ hóa theo thời gian thực thông qua giao diện InfiniBand 56G, có thông lượng cao và độ trễ thấp. Để tận dụng tối đa kênh liên lạc khi truyền các gói tin nhỏ. Bởi vì chỉ có một kênh liên lạc; một liên kết 1GbE chuyên dụng được sử dụng để kiểm tra nhịp tim bổ sung. Chỉ có nhịp tim được truyền qua nó nên không có yêu cầu nào về đặc tính tốc độ.
Trong trường hợp tăng dung lượng hệ thống (lên tới 400+TB) do chúng cũng được kết nối theo cặp để duy trì khái niệm “không có điểm lỗi duy nhất”.
Để bảo vệ dữ liệu bổ sung (ngoài thực tế là AccelStor đã có hai bản sao), một thuật toán hành vi đặc biệt được sử dụng trong trường hợp bất kỳ ổ SSD nào bị lỗi. Nếu SSD bị lỗi, nút sẽ bắt đầu xây dựng lại dữ liệu vào một trong các ổ đĩa dự phòng nóng. Nhóm FlexiRemap đang ở trạng thái xuống cấp sẽ chuyển sang chế độ chỉ đọc. Điều này được thực hiện để loại bỏ sự can thiệp giữa các hoạt động ghi và xây dựng lại trên đĩa sao lưu, điều này cuối cùng sẽ tăng tốc quá trình khôi phục và giảm thời gian khi hệ thống có khả năng bị tấn công. Sau khi hoàn tất việc xây dựng lại, nút sẽ trở về chế độ đọc-ghi bình thường.

Tất nhiên, giống như các hệ thống khác, trong quá trình xây dựng lại, hiệu suất tổng thể sẽ giảm (xét cho cùng, một trong các nhóm FlexiRemap không hoạt động để ghi). Nhưng bản thân quá trình khôi phục diễn ra nhanh nhất có thể, điều này giúp phân biệt hệ thống AccelStor với các giải pháp của các nhà cung cấp khác.
Một thuộc tính hữu ích khác của công nghệ kiến trúc Nothing Shared là hoạt động của các nút ở chế độ được gọi là chế độ hoạt động thực sự. Không giống như kiến trúc “cổ điển”, trong đó chỉ có một bộ điều khiển sở hữu một ổ đĩa/nhóm cụ thể và bộ điều khiển thứ hai chỉ thực hiện các thao tác I/O, trong các hệ thống mỗi nút hoạt động với bộ dữ liệu riêng và không truyền yêu cầu đến “hàng xóm” của nó. Kết quả là hiệu suất tổng thể của hệ thống được cải thiện nhờ xử lý song song các yêu cầu I/O của các nút và quyền truy cập vào ổ đĩa. Hầu như không có thứ gọi là chuyển đổi dự phòng, vì đơn giản là không cần chuyển quyền kiểm soát các ổ sang nút khác trong trường hợp xảy ra lỗi.
Nếu chúng ta so sánh công nghệ kiến trúc Nothing Shared với việc sao chép hệ thống lưu trữ chính thức, thì thoạt nhìn, nó sẽ kém hơn một chút so với việc thực hiện đầy đủ tính linh hoạt của việc khắc phục thảm họa. Điều này đặc biệt đúng đối với việc tổ chức đường dây liên lạc giữa các hệ thống lưu trữ. Do đó, trong mô hình H710, có thể trải rộng các nút trong khoảng cách lên tới 100m thông qua việc sử dụng cáp quang hoạt động InfiniBand không hề rẻ. Nhưng ngay cả khi so sánh với việc triển khai sao chép đồng bộ thông thường từ các nhà cung cấp khác thông qua FibreChannel có sẵn, thậm chí trên khoảng cách xa hơn, giải pháp từ AccelStor sẽ rẻ hơn và dễ cài đặt/vận hành hơn, bởi vì không cần phải cài đặt bộ ảo hóa lưu trữ và/hoặc tích hợp với phần mềm (về nguyên tắc không phải lúc nào cũng có thể thực hiện được). Ngoài ra, đừng quên rằng giải pháp AccelStor đều là mảng Flash có hiệu suất cao hơn so với các hệ thống lưu trữ “cổ điển” chỉ có SSD.

Khi sử dụng kiến trúc Nothing Shared của AccelStor, có thể đạt được độ khả dụng của hệ thống lưu trữ là 99.9999% với chi phí rất hợp lý. Cùng với độ tin cậy cao của giải pháp, bao gồm việc sử dụng hai bản sao dữ liệu và hiệu suất ấn tượng nhờ các thuật toán độc quyền , giải pháp từ là những ứng viên xuất sắc cho các vị trí chủ chốt khi xây dựng trung tâm dữ liệu hiện đại.
Nguồn: www.habr.com
