Něco málo o SMART a monitorovacích nástrojích

Na internetu je spousta informací o SMART a hodnotách atributů. Ale nenarazil jsem na žádnou zmínku o několika důležitých bodech, o kterých vím od lidí zabývajících se studiem paměťových médií.

Když jsem opět vyprávěl kamarádovi o tom, proč by se SMART odečtům nemělo bezpodmínečně věřit a proč je lepší nepoužívat pořád klasické „SMART monitory“, napadlo mě zapsat vyřčená slova ve formě soubor tezí s vysvětlivkami. Poskytovat odkazy místo převyprávění pokaždé. A zpřístupnit ji širšímu publiku.

1) Programy pro automatické sledování atributů SMART by měly být používány s velkou opatrností.

To, co znáte jako atributy SMART, nejsou uloženy jako hotové, ale jsou generovány v okamžiku, kdy si je vyžádáte. Vypočítávají se na základě interních statistik shromážděných a používaných firmwarem disku během provozu.

Zařízení některá z těchto dat nepotřebuje k zajištění základní funkčnosti. A neukládá se, ale generuje se pokaždé, když je potřeba. Když tedy dojde k požadavku na atributy SMART, firmware spustí velké množství procesů, které jsou potřeba k získání chybějících dat.

Tyto procesy jsou však špatně kompatibilní s postupy prováděnými, když je jednotka zatížena operacemi čtení a zápisu.

V ideálním světě by to nemělo způsobovat žádné problémy. Ale ve skutečnosti firmware pevného disku píší obyčejní lidé. Kdo může a dělá chyby. Pokud se tedy dotazujete na atributy SMART, zatímco zařízení aktivně provádí operace čtení a zápisu, pravděpodobnost, že se něco pokazí, se dramaticky zvýší. Například data ve vyrovnávací paměti pro čtení nebo zápis uživatele budou poškozena.

Tvrzení o zvyšujících se rizicích není teoretickým závěrem, ale praktickým pozorováním. Například je známá chyba, která se vyskytla ve firmwaru HDD Samsung 103UI, kdy byla poškozena uživatelská data během procesu vyžádání atributů SMART.

Nekonfigurujte proto automatickou kontrolu atributů SMART. Pokud si nejste jisti, že příkaz vyprázdnění mezipaměti (Flush Cache) je vydán před tímto. Nebo, pokud se bez něj neobejdete, nakonfigurujte kontrolu tak, aby se spouštěla ​​co nejméně. V mnoha monitorovacích programech je výchozí doba mezi kontrolami přibližně 10 minut. To je příliš běžné. Přesto takové kontroly nejsou všelékem na neočekávané selhání disku (všelékem je pouze záloha). Jednou denně – myslím, že to stačí.

Dotazování teploty nespouští procesy výpočtu atributů a může být prováděno často. Protože při správné implementaci se to děje prostřednictvím protokolu SCT. Prostřednictvím SCT se rozdává pouze to, co je již známo. Tato data se automaticky aktualizují na pozadí.

2) Data atributů SMART jsou často nespolehlivá.

Firmware pevného disku vám ukáže, co si myslí, že by vám měl ukázat, ne to, co se ve skutečnosti děje. Nejviditelnějším příkladem je 5. atribut, počet nově přidělených sektorů. Specialisté na obnovu dat dobře vědí, že pevný disk může vykazovat nulový počet realokací v pátém atributu, přestože existují a stále se objevují.

Položil jsem otázku specialistovi, který studuje pevné disky a zkoumá jejich firmware. Zeptal jsem se, jaký je princip, podle kterého firmware zařízení rozhoduje, že nyní je nutné skrýt skutečnost přeřazení sektoru, ale nyní o tom můžete mluvit prostřednictvím atributů SMART.

Odpověděl, že neexistuje žádné obecné pravidlo, podle kterého zařízení ukazují nebo skrývají skutečný obraz. A logika programátorů, kteří píší firmware pro pevné disky, někdy vypadá velmi zvláštně. Při studiu firmwaru různých modelů zjistil, že rozhodnutí „skrýt nebo zobrazit“ je často učiněno na základě souboru parametrů, které obecně nejsou jasné, jak souvisejí mezi sebou a se zbývajícím zdrojem pevného disku.

3) Interpretace indikátorů SMART je specifická pro dodavatele.

Například na Seagates byste neměli věnovat pozornost „špatným“ nezpracovaným hodnotám atributů 1 a 7, pokud je zbytek normální. U disků tohoto výrobce se mohou jejich absolutní hodnoty při běžném používání zvýšit.

Něco málo o SMART a monitorovacích nástrojích

Pro posouzení stavu a zbývající životnosti pevného disku se v první řadě doporučuje věnovat pozornost parametrům 5, 196, 197, 198. Navíc má smysl zaměřit se na absolutní, hrubé hodnoty a ne na ty dané. . Vynucování atributů lze provádět nezřejmými způsoby, odlišnými v různých algoritmech a firmwaru.

Obecně platí, že mezi specialisty na ukládání dat, když mluví o hodnotě atributu, obvykle myslí absolutní hodnotu.

Zdroj: www.habr.com

Přidat komentář