Ein wenig über SMART und Überwachungsdienstprogramme

Im Internet gibt es viele Informationen zu SMART und Attributwerten. Aber ich habe einige wichtige Punkte, die ich von Leuten kenne, die sich mit der Erforschung von Speichermedien befassen, nicht erwähnt.

Als ich einem Freund noch einmal davon erzählte, warum man SMART-Zeugnissen nicht bedingungslos vertrauen sollte und warum man besser nicht ständig die klassischen „SMART-Monitore“ verwenden sollte, kam mir die Idee, die gesprochenen Worte in der Form eines aufzuschreiben Satz von Thesen mit Erläuterungen. Um Links zu geben, anstatt sie jedes Mal neu zu erzählen. Und für ein breites Publikum.

1) Programme zur automatischen Überwachung von SMART-Attributen sollten mit großer Vorsicht eingesetzt werden.

Was Sie als SMART-Attribute kennen, werden nicht standardmäßig gespeichert, sondern in dem Moment generiert, in dem Sie sie anfordern. Sie werden auf der Grundlage interner Statistiken berechnet, die von der Firmware des Laufwerks während des Betriebs gesammelt und verwendet werden.

Ein Teil dieser Daten wird vom Gerät nicht benötigt, um die Hauptfunktionalität bereitzustellen. Und es wird nicht gespeichert, sondern jedes Mal neu gebildet, wenn es benötigt wird. Daher startet die Firmware bei einer SMART-Attributanforderung eine große Anzahl von Prozessen, die zum Abrufen der fehlenden Daten erforderlich sind.

Diese Prozesse sind jedoch schlecht mit den Vorgängen kompatibel, die beim Laden des Laufwerks mit Lese-/Schreibvorgängen ausgeführt werden.

In einer idealen Welt sollte dies keine Probleme verursachen. Aber in Wirklichkeit wird die Festplatten-Firmware von normalen Leuten geschrieben. Wer kann und darf Fehler machen? Wenn Sie also SMART-Attribute anfordern, während das Gerät aktiv Lese-/Schreibvorgänge ausführt, erhöht sich die Wahrscheinlichkeit, dass etwas schief geht, erheblich. Beispielsweise werden die Daten im Lese- oder Schreibpuffer des Benutzers beschädigt.

Die Aussage über die Zunahme der Risiken ist keine theoretische Schlussfolgerung, sondern eine praktische Beobachtung. Es gibt beispielsweise einen bekannten Fehler in der Samsung 103UI HDD-Firmware, bei dem Benutzerdaten während der Ausführung einer SMART-Attributanforderung beschädigt wurden.

Konfigurieren Sie daher keine automatische SMART-Attributprüfung. Es sei denn, Sie wissen sicher, dass zuvor der Befehl zum Leeren des Caches (Flush Cache) gegeben wurde. Oder wenn Sie darauf nicht verzichten können, konfigurieren Sie die Prüfung so, dass sie so selten wie möglich durchgeführt wird. In vielen Überwachungsprogrammen liegt die Standardzeit zwischen den Überprüfungen in der Größenordnung von 10 Minuten. Es kommt zu oft vor. Dennoch sind solche Überprüfungen kein Allheilmittel gegen einen unerwarteten Festplattenausfall (ein Allheilmittel ist nur Redundanz). Einmal am Tag ist meiner Meinung nach ausreichend.

Eine Temperaturanforderung löst keine Attributberechnungsprozesse aus und kann häufig durchgeführt werden. Denn bei richtiger Umsetzung erfolgt dies über das SCT-Protokoll. Über das SCT wird nur das bereitgestellt, was bereits bekannt ist. Diese Daten werden automatisch im Hintergrund aktualisiert.

2) SMART-Attributdaten sind oft unzuverlässig.

Die Festplatten-Firmware zeigt Ihnen, was sie Ihnen zeigen möchte, nicht, was tatsächlich passiert. Das offensichtlichste Beispiel ist das 5. Attribut, die Anzahl der neu zugewiesenen Sektoren. Datenrettungsspezialisten sind sich bewusst, dass eine Festplatte im fünften Attribut keine Neuzuweisungen aufweisen kann, auch wenn diese vorhanden sind und weiterhin angezeigt werden.

Ich habe einen Spezialisten gefragt, der Festplatten untersucht und deren Firmware untersucht. Ich fragte nach dem Prinzip, nach dem die Firmware des Geräts entscheidet, dass es im Moment notwendig ist, die Tatsache der Sektorneuzuweisung zu verbergen, und dass Sie jetzt über die SMART-Attribute darüber sprechen können.

Er antwortete, dass es keine allgemeine Regel gebe, nach der Geräte das tatsächliche Bild anzeigen oder verbergen. Und die Logik von Programmierern, die Firmware für Festplatten schreiben, sieht manchmal sehr seltsam aus. Bei der Untersuchung der Firmware verschiedener Modelle stellte er fest, dass die Entscheidung zum „Ausblenden oder Anzeigen“ häufig auf der Grundlage einer Reihe von Parametern getroffen wird, bei denen im Allgemeinen nicht klar ist, in welcher Beziehung sie zueinander und zur verbleibenden Festplattenressource stehen.

3) Die Interpretation von SMART-Scores ist herstellerspezifisch.

Bei Seagates sollten Sie beispielsweise nicht auf die „schlechten“ Rohwerte der Attribute 1 und 7 achten, während der Rest normal ist. Bei Laufwerken dieses Herstellers können sich deren absolute Werte bei normalem Gebrauch erhöhen.

Ein wenig über SMART und Überwachungsdienstprogramme

Um den Zustand und die Restressourcen einer Festplatte zu beurteilen, empfiehlt es sich zunächst, auf die Parameter 5, 196, 197, 198 zu achten. Darüber hinaus ist es sinnvoll, sich auf absolute Rohwerte (raw) und zu konzentrieren nicht auf die angegebenen. Die Attributumwandlung kann auf nicht offensichtliche Weise durchgeführt werden, die je nach Algorithmus und Firmware unterschiedlich ist.

Generell ist im Umfeld von Spezialisten für Informationsträger, wenn vom Wert eines Attributs die Rede ist, meist der absolute Wert gemeint.

Source: habr.com

Kommentar hinzufügen