關於 SMART 和監控實用程式的一些信息

網路上有很多關於SMART和屬性值的資訊。但我還沒有從參與儲存媒體研究的人那裡看到我所知道的幾個重要觀點。

當我再次向一位朋友講述為什麼 SMART 讀數不應該被無條件信任以及為什麼最好不要一直使用經典的“SMART 顯示器”時,我想到了以一種形式寫下所說的話。一套帶有解釋的論文。提供連結而不是每次都重述。並使其可供更廣泛的受眾使用。

1) 應謹慎使用自動監控 SMART 屬性的程序。

您所知道的 SMART 屬性並不是現成儲存的,而是在您要求時產生的。它們是根據驅動器韌體在運行期間累積和使用的內部統計數據計算的。

該設備不需要其中一些數據來提供基本功能。並且它不是儲存的,而是每次需要時產生的。因此,當發生 SMART 屬性的請求時,韌體會啟動取得遺失資料所需的大量進程。

但這些過程與驅動器載入讀寫操作時執行的過程相容性很差。

在理想的情況下,這不會造成任何問題。但實際上,硬碟韌體是普通人寫的。誰可以而且確實會犯錯。因此,如果在設備主動執行讀寫操作時查詢 SMART 屬性,出現問題的可能性會急劇增加。例如,使用者的讀取或寫入緩衝區中的資料將被損壞。

關於風險增加的說法不是理論結論,而是實務觀察。例如,三星103UI硬碟的韌體中存在一個已知錯誤,在請求SMART屬性的過程中用戶資料被損壞。

因此,不要配置SMART屬性的自動檢查。除非你確定知道快取刷新指令(Flush Cache)在此之前發出。或者,如果您離不開它,請將掃描配置為盡可能少地運行。在許多監控程序中,檢查之間的預設時間約為 10 分鐘。這太常見了。儘管如此,此類檢查並不是解決意外磁碟故障的萬用藥(萬用藥只是備份)。一天一次——我認為已經足夠了。

查詢溫度不會觸發屬性計算過程,可以頻繁執行。因為如果正確實施,這是透過 SCT 協議完成的。透過 SCT,只有已知的資訊才會被洩漏。該數據在後台自動更新。

2)SMART屬性資料往往不可靠。

硬碟韌體向您顯示它認為應該向您顯示的內容,而不是實際發生的情況。最明顯的例子是第五個屬性,也就是重新指派的磁區數。資料復原專家非常清楚,硬碟在第五個屬性中可以顯示零數量的重新分配,即使它們存在並繼續出現。

我向一位研究硬碟並檢查其韌體的專家提出了一個問題。我問設備的韌體決定現在需要隱藏扇區重新分配的事實的原理是什麼,但是現在可以透過SMART屬性來談論它。

他回答說,沒有一般規則根據哪些設備顯示或隱藏真實圖片。而為硬碟編寫韌體的程式設計師的邏輯有時看起來很奇怪。透過研究不同型號的韌體,他發現「隱藏或顯示」的決定通常是基於一組參數做出的,這些參數通常不清楚它們之間的關係以及與硬碟剩餘資源的關係。

3) SMART 指標的解釋是特定於供應商的。

例如,在希捷上,您不應該關注屬性1和7的「壞」原始值,只要其餘正常即可。在該製造商生產的磁碟上,其絕對值在正常使用期間可能會增加。

關於 SMART 和監控實用程式的一些信息

要評估硬碟的狀況和剩餘壽命,首先建議專注於參數 5、196、197、198。此外,專注於絕對值、原始值而不是給定值是有意義的。屬性的強制可以以非顯而易見的方式執行,在不同的演算法和韌體中有所不同。

一般來說,在資料儲存專家中,當他們談論屬性的值時,他們通常指的是絕對值。

來源: www.habr.com

添加評論