Đôi nét về SMART và tiện ích giám sát

Có rất nhiều thông tin trên Internet về SMART và các giá trị thuộc tính. Nhưng tôi chưa thấy đề cập đến một số điểm quan trọng mà tôi biết từ những người tham gia nghiên cứu phương tiện lưu trữ.

Khi tôi một lần nữa nói với một người bạn về lý do tại sao không nên tin cậy vô điều kiện các bài đọc SMART và tại sao tốt hơn hết là không nên sử dụng “màn hình SMART” cổ điển mọi lúc, tôi chợt nảy ra ý tưởng viết ra những từ được nói dưới dạng một bộ luận văn có lời giải. Để cung cấp liên kết thay vì kể lại mỗi lần. Và để nó có thể đến được với nhiều đối tượng hơn.

1) Cần hết sức thận trọng khi sử dụng các chương trình giám sát tự động các thuộc tính SMART.

Những gì bạn biết là thuộc tính SMART không được lưu trữ sẵn mà được tạo ngay khi bạn yêu cầu. Chúng được tính toán dựa trên số liệu thống kê nội bộ được tích lũy và sử dụng bởi phần sụn của ổ đĩa trong quá trình hoạt động.

Thiết bị không cần một số dữ liệu này để cung cấp chức năng cơ bản. Và nó không được lưu trữ mà được tạo ra mỗi khi được yêu cầu. Do đó, khi yêu cầu thuộc tính SMART xảy ra, phần sụn sẽ khởi chạy một số lượng lớn quy trình cần thiết để lấy dữ liệu bị thiếu.

Nhưng các quy trình này kém tương thích với các quy trình được thực hiện khi ổ đĩa được tải các thao tác đọc-ghi.

Trong một thế giới lý tưởng, điều này sẽ không gây ra bất kỳ vấn đề gì. Nhưng trên thực tế, firmware ổ cứng được viết bởi người bình thường. Ai có thể và có thể mắc sai lầm. Do đó, nếu bạn truy vấn các thuộc tính SMART trong khi thiết bị đang tích cực thực hiện các hoạt động đọc-ghi, khả năng xảy ra sự cố sẽ tăng lên đáng kể. Ví dụ: dữ liệu trong bộ đệm đọc hoặc ghi của người dùng sẽ bị hỏng.

Tuyên bố về việc gia tăng rủi ro không phải là một kết luận mang tính lý thuyết mà là một quan sát thực tế. Ví dụ: có một lỗi đã biết xảy ra trong phần sụn của ổ cứng HDD Samsung 103UI, khiến dữ liệu người dùng bị hỏng trong quá trình yêu cầu thuộc tính SMART.

Do đó, không định cấu hình tự động kiểm tra các thuộc tính SMART. Trừ khi bạn biết chắc chắn rằng lệnh xóa bộ đệm (Flush Cache) được đưa ra trước đó. Hoặc, nếu bạn không thể làm gì nếu không có nó, hãy định cấu hình quá trình quét để chạy ít nhất có thể. Trong nhiều chương trình giám sát, thời gian mặc định giữa các lần kiểm tra là khoảng 10 phút. Điều này quá phổ biến. Tuy nhiên, việc kiểm tra như vậy không phải là thuốc chữa bách bệnh cho tình trạng hỏng ổ đĩa không mong muốn (thuốc chữa bách bệnh chỉ có tác dụng dự phòng). Mỗi ngày một lần – tôi nghĩ thế là đủ rồi.

Nhiệt độ truy vấn không kích hoạt quá trình tính toán thuộc tính và có thể được thực hiện thường xuyên. Bởi vì khi được triển khai chính xác, việc này được thực hiện thông qua giao thức SCT. Thông qua SCT, chỉ những gì đã biết mới được cho đi. Dữ liệu này được cập nhật tự động trong nền.

2) Dữ liệu thuộc tính SMART thường không đáng tin cậy.

Phần sụn ổ cứng hiển thị cho bạn những gì nó cho là sẽ hiển thị cho bạn, chứ không phải những gì đang thực sự xảy ra. Ví dụ rõ ràng nhất là thuộc tính thứ 5, số lượng các cung được gán lại. Các chuyên gia phục hồi dữ liệu nhận thức rõ rằng ổ cứng có thể hiển thị số lượng phân bổ lại bằng XNUMX trong thuộc tính thứ năm, mặc dù chúng tồn tại và tiếp tục xuất hiện.

Tôi đã đặt câu hỏi cho một chuyên gia nghiên cứu ổ đĩa cứng và kiểm tra phần sụn của họ. Tôi đã hỏi nguyên tắc mà phần sụn của thiết bị quyết định rằng bây giờ cần phải che giấu sự thật về việc gán lại khu vực, nhưng bây giờ bạn có thể nói về nó thông qua các thuộc tính SMART.

Anh ấy trả lời rằng không có quy tắc chung nào về việc thiết bị nào hiển thị hay ẩn hình ảnh thật. Và logic của các lập trình viên viết firmware cho ổ cứng đôi khi trông rất kỳ lạ. Nghiên cứu phần sụn của các mẫu máy khác nhau, anh thấy rằng quyết định “ẩn hay hiển thị” thường được đưa ra dựa trên một tập hợp các tham số thường không rõ ràng chúng có liên quan như thế nào với nhau và với tài nguyên còn lại của ổ cứng.

3) Việc giải thích các chỉ số SMART tùy theo từng nhà cung cấp.

Ví dụ: trên Seagates bạn không nên chú ý đến giá trị thô “xấu” của thuộc tính 1 và 7, miễn là các giá trị còn lại đều bình thường. Trên các đĩa của nhà sản xuất này, giá trị tuyệt đối của chúng có thể tăng lên trong quá trình sử dụng bình thường.

Đôi nét về SMART và tiện ích giám sát

Để đánh giá tình trạng và tuổi thọ còn lại của ổ cứng, trước hết nên chú ý đến các thông số 5, 196, 197, 198. Hơn nữa, nên tập trung vào các giá trị tuyệt đối, thô chứ không phải các giá trị đã cho . Việc ép buộc các thuộc tính có thể được thực hiện theo những cách không rõ ràng, khác nhau về các thuật toán và phần sụn khác nhau.

Nhìn chung, trong số các chuyên gia lưu trữ dữ liệu, khi nói về giá trị của một thuộc tính, họ thường muốn nói đến giá trị tuyệt đối.

Nguồn: www.habr.com

Thêm một lời nhận xét