SMART と監視ユーティリティについて少し

インターネット上には、SMART と属性値に関する情報がたくさんあります。 しかし、記憶メディアの研究に携わっている人々から私が知っているいくつかの重要な点については、まったく言及されていません。

SMART の測定値を無条件に信頼すべきではない理由と、古典的な「SMART モニター」を常に使用しないほうがよい理由についてもう一度友人に話したとき、話された言葉を文字の形で書き留めることが思いつきました。解説付きの論文セット。 毎回説明する代わりにリンクを提供するため。 そしてそれをより多くの人が利用できるようにすること。

1) SMART 属性を自動監視するプログラムは、細心の注意を払って使用する必要があります。

SMART 属性として認識されているものは、既成の状態で保存されるのではなく、要求した瞬間に生成されます。 これらは蓄積された内部統計に基づいて計算され、動作中にドライブのファームウェアによって使用されます。

デバイスは、基本的な機能を提供するためにこのデータの一部を必要としません。 そして、それは保存されず、必要になるたびに生成されます。 したがって、SMART 属性の要求が発生すると、ファームウェアは欠落データを取得するために必要な多数のプロセスを起動します。

ただし、これらのプロセスは、ドライブに読み取り/書き込み操作がロードされるときに実行される手順との互換性が低くなります。

理想的な世界では、これによって問題が発生することはありません。 しかし実際には、ハードドライブのファームウェアは一般の人によって書かれています。 誰が間違いを犯す可能性があり、実際に間違いを犯す可能性があるのか​​。 したがって、デバイスが読み取り/書き込み操作をアクティブに実行しているときに SMART 属性をクエリすると、問題が発生する可能性が大幅に高まります。 たとえば、ユーザーの読み取りまたは書き込みバッファ内のデータが破損します。

リスクの増大に関する記述は理論的な結論ではなく、実際的な観察です。 たとえば、HDD Samsung 103UI のファームウェアで発生した既知のバグがあり、SMART 属性を要求するプロセス中にユーザー データが破損しました。

したがって、SMART 属性の自動チェックを構成しないでください。 この前にキャッシュ フラッシュ コマンド (Flush Cache) が発行されたことが確実にわかっている場合を除きます。 または、それなしではいられない場合は、スキャンができるだけまれに実行されるように構成します。 多くの監視プログラムでは、デフォルトのチェック間隔は約 10 分です。 これはあまりにも一般的です。 いずれにしても、このようなチェックは予期せぬディスク障害に対する万能薬ではありません (万能薬はバックアップにすぎません)。 XNUMX 日 XNUMX 回で十分だと思います。

温度のクエリは属性計算プロセスをトリガーせず、頻繁に実行できます。 正しく実装されている場合、これは SCT プロトコルを通じて行われるためです。 SCT を通じて、すでに知られているものだけが提供されます。 このデータはバックグラウンドで自動的に更新されます。

2) SMART 属性データは信頼できないことがよくあります。

ハードドライブのファームウェアは、実際に何が起こっているかではなく、表示すべきと考えているものを表示します。 最もわかりやすい例は 5 番目の属性、再割り当てされたセクターの数です。 データ回復の専門家は、ハード ドライブの XNUMX 番目の属性に再割り当て数が存在し、表示され続ける場合でも、ゼロの数が表示される可能性があることをよく知っています。

ハードドライブを研究し、ファームウェアを検査する専門家に質問しました。 私は、デバイスのファームウェアがセクター再割り当ての事実を隠す必要があると判断する原理は何なのかと尋ねましたが、現在は SMART 属性を通じてそれについて話すことができます。

彼は、どのデバイスが実際の画像を表示するか非表示にするかに関する一般的な規則はないと答えました。 また、ハードドライブのファームウェアを作成するプログラマーのロジックは、非常に奇妙に見えることがあります。 さまざまなモデルのファームウェアを研究したところ、多くの場合、「非表示または表示」の決定は、それらが相互にどのように関係しているのか、またハード ドライブの残りのリソースとどのように関係しているのかが一般に不明瞭な一連のパラメータに基づいて決定されることがわかりました。

3) SMART インジケーターの解釈はベンダーによって異なります。

たとえば、Seagates では、残りが正常である限り、属性 1 と 7 の「悪い」生の値に注意を払う必要はありません。 このメーカーのディスクでは、通常の使用中に絶対値が増加する可能性があります。

SMART と監視ユーティリティについて少し

ハードドライブの状態と残りの寿命を評価するには、まずパラメータ 5、196、197、198 に注意を払うことをお勧めします。さらに、指定された値ではなく、生の絶対値に焦点を当てることは理にかなっています。 。 属性の強制は、アルゴリズムやファームウェアによって異なる、非自明な方法で実行できます。

一般に、データ ストレージの専門家の間では、属性の値について話す場合、通常は絶対値を意味します。

出所: habr.com

コメントを追加します