Trochę o SMART i narzędziach monitorujących

W Internecie można znaleźć wiele informacji na temat SMART i wartości atrybutów. Nie spotkałem się jednak z żadną wzmianką o kilku ważnych kwestiach, o których wiem od osób zajmujących się badaniem nośników danych.

Kiedy po raz kolejny opowiadałem znajomemu, dlaczego nie należy bezwarunkowo ufać odczytom SMART i dlaczego lepiej nie używać cały czas klasycznych „monitorów SMART”, przyszedł mi do głowy pomysł, aby spisywać wypowiadane słowa w formie zestaw tez z objaśnieniami. Aby podawać linki zamiast za każdym razem powtarzać. I udostępnienie go szerszemu gronu odbiorców.

1) Programów do automatycznego monitorowania atrybutów SMART należy używać z dużą ostrożnością.

To, co znasz jako atrybuty SMART, nie jest przechowywane w postaci gotowej, ale generowane w momencie, gdy o nie poprosisz. Obliczane są na podstawie wewnętrznych statystyk zgromadzonych i wykorzystywanych przez oprogramowanie sprzętowe dysku podczas pracy.

Urządzenie nie potrzebuje części tych danych do zapewnienia podstawowej funkcjonalności. I nie jest on przechowywany, ale generowany za każdym razem, gdy jest potrzebny. Dlatego też, gdy pojawia się żądanie atrybutów SMART, oprogramowanie sprzętowe uruchamia dużą liczbę procesów niezbędnych do uzyskania brakujących danych.

Jednak procesy te są słabo kompatybilne z procedurami wykonywanymi, gdy dysk jest obciążony operacjami odczytu i zapisu.

W idealnym świecie nie powinno to powodować żadnych problemów. Ale w rzeczywistości oprogramowanie sprzętowe dysku twardego jest pisane przez zwykłych ludzi. Kto może i popełnia błędy. Dlatego też, jeśli odpytujesz atrybuty SMART, gdy urządzenie aktywnie wykonuje operacje odczytu i zapisu, prawdopodobieństwo, że coś pójdzie nie tak, dramatycznie wzrasta. Na przykład dane w buforze odczytu lub zapisu użytkownika zostaną uszkodzone.

Stwierdzenie o rosnącym ryzyku nie jest wnioskiem teoretycznym, lecz obserwacją praktyczną. Na przykład znany jest błąd w oprogramowaniu HDD Samsung 103UI, który powoduje uszkodzenie danych użytkownika w procesie żądania atrybutów SMART.

Dlatego nie należy konfigurować automatycznego sprawdzania atrybutów SMART. Chyba że wiesz na pewno, że polecenie opróżnienia pamięci podręcznej (Flush Cache) zostało wydane wcześniej. Lub, jeśli nie możesz się bez tego obejść, skonfiguruj skanowanie tak, aby uruchamiało się tak rzadko, jak to możliwe. W wielu programach monitorujących domyślny czas pomiędzy kontrolami wynosi około 10 minut. To jest zbyt powszechne. Niemniej jednak takie kontrole nie są panaceum na nieoczekiwaną awarię dysku (panaceum to tylko kopia zapasowa). Raz dziennie – myślę, że w zupełności wystarczy.

Zapytanie o temperaturę nie uruchamia procesów obliczania atrybutów i może być wykonywane często. Ponieważ przy prawidłowym zaimplementowaniu odbywa się to za pośrednictwem protokołu SCT. Dzięki SCT przekazywane jest tylko to, co już wiadomo. Dane te są aktualizowane automatycznie w tle.

2) Dane atrybutów SMART są często zawodne.

Oprogramowanie sprzętowe dysku twardego pokazuje to, co według niego powinno, a nie to, co się faktycznie dzieje. Najbardziej oczywistym przykładem jest piąty atrybut, liczba ponownie przypisanych sektorów. Specjaliści od odzyskiwania danych doskonale zdają sobie sprawę, że dysk twardy może wykazywać zerową liczbę realokacji w piątym atrybucie, mimo że istnieją i nadal się pojawiają.

Zadałem pytanie specjalistowi, który bada dyski twarde i bada ich oprogramowanie. Zapytałem, na jakiej zasadzie oprogramowanie urządzenia decyduje, że teraz trzeba ukryć fakt zmiany sektora, ale teraz można o tym mówić poprzez atrybuty SMART.

Odpowiedział, że nie ma ogólnej reguły, według której urządzenia pokazują, a jakie ukrywają rzeczywisty obraz. A logika programistów piszących oprogramowanie układowe dla dysków twardych czasami wygląda bardzo dziwnie. Studiując oprogramowanie sprzętowe różnych modeli, zauważył, że często decyzja o „ukryciu lub pokazaniu” jest podejmowana na podstawie zestawu parametrów, które generalnie nie są jasne, w jaki sposób są one powiązane ze sobą i z pozostałymi zasobami dysku twardego.

3) Interpretacja wskaźników SMART zależy od dostawcy.

Na przykład w Seagates nie należy zwracać uwagi na „złe” surowe wartości atrybutów 1 i 7, o ile reszta jest normalna. Na dyskach tego producenta ich wartości bezwzględne mogą wzrosnąć podczas normalnego użytkowania.

Trochę o SMART i narzędziach monitorujących

Aby ocenić stan i pozostałą żywotność dysku twardego, zaleca się przede wszystkim zwrócenie uwagi na parametry 5, 196, 197, 198. Ponadto warto skupić się na wartościach bezwzględnych, surowych, a nie na danych . Wymuszenie atrybutów może odbywać się w sposób nieoczywisty, różniący się w zależności od algorytmów i oprogramowania sprzętowego.

Ogólnie rzecz biorąc, wśród specjalistów zajmujących się przechowywaniem danych, mówiąc o wartości atrybutu, zwykle mają na myśli wartość bezwzględną.

Źródło: www.habr.com

Dodaj komentarz