Trochu o SMART a monitorovacích nástrojoch

Na internete je veľa informácií o SMART a hodnotách atribútov. Nestretol som sa však so žiadnou zmienkou o niekoľkých dôležitých bodoch, o ktorých viem od ľudí, ktorí sa zaoberajú štúdiom pamäťových médií.

Keď som opäť raz rozprával kamarátovi o tom, prečo by sa SMART čítaniam nemalo bezpodmienečne dôverovať a prečo je lepšie nepoužívať stále klasické „SMART monitory“, napadlo ma zapísať si vyslovené slová vo forme súbor téz s vysvetlivkami. Poskytovať odkazy namiesto prerozprávania zakaždým. A sprístupniť ho širšiemu publiku.

1) Programy na automatické monitorovanie atribútov SMART by sa mali používať s veľkou opatrnosťou.

To, čo poznáte ako atribúty SMART, nie sú uložené ako hotové, ale sú generované v momente, keď si ich vyžiadate. Vypočítavajú sa na základe interných štatistík zhromaždených a používaných firmvérom disku počas prevádzky.

Zariadenie nepotrebuje niektoré z týchto údajov na poskytovanie základnej funkčnosti. A neukladá sa, ale generuje sa vždy, keď je to potrebné. Preto, keď sa vyskytne požiadavka na atribúty SMART, firmvér spustí veľké množstvo procesov, ktoré sú potrebné na získanie chýbajúcich údajov.

Tieto procesy sú však nedostatočne kompatibilné s postupmi vykonávanými, keď je jednotka zaťažená operáciami čítania a zápisu.

V ideálnom svete by to nemalo spôsobovať žiadne problémy. V skutočnosti však firmvér pevného disku píšu obyčajní ľudia. Kto môže a robí chyby. Preto, ak sa dotazujete na atribúty SMART, zatiaľ čo zariadenie aktívne vykonáva operácie čítania a zápisu, pravdepodobnosť, že sa niečo pokazí, sa dramaticky zvýši. Poškodia sa napríklad údaje vo vyrovnávacej pamäti používateľa na čítanie alebo zápis.

Konštatovanie o zvyšujúcich sa rizikách nie je teoretickým záverom, ale praktickým pozorovaním. Známa je napríklad chyba, ktorá sa vyskytla vo firmvéri HDD Samsung 103UI, kde došlo k poškodeniu používateľských údajov počas procesu vyžiadania atribútov SMART.

Preto nekonfigurujte automatickú kontrolu atribútov SMART. Pokiaľ si nie ste istý, že príkaz na vyprázdnenie vyrovnávacej pamäte (Flush Cache) je zadaný ešte pred týmto. Alebo, ak sa bez neho nezaobídete, nakonfigurujte kontrolu tak, aby sa spúšťala čo najmenej. V mnohých monitorovacích programoch je predvolený čas medzi kontrolami približne 10 minút. Toto je príliš bežné. Napriek tomu takéto kontroly nie sú všeliekom na neočakávané zlyhanie disku (všeliek je iba záloha). Raz denne – myslím, že úplne stačí.

Zisťovanie teploty nespúšťa procesy výpočtu atribútov a môže sa vykonávať často. Pretože pri správnej implementácii sa to robí prostredníctvom protokolu SCT. Prostredníctvom SCT sa odovzdáva len to, čo je už známe. Tieto údaje sa automaticky aktualizujú na pozadí.

2) Údaje o atribútoch SMART sú často nespoľahlivé.

Firmvér pevného disku vám ukáže to, čo si myslí, že by vám mal ukázať, nie to, čo sa v skutočnosti deje. Najzrejmejším príkladom je 5. atribút, počet preradených sektorov. Špecialisti na obnovu dát dobre vedia, že pevný disk môže vykazovať nulový počet prerozdelení v piatom atribúte, aj keď existujú a stále sa objavujú.

Položil som otázku špecialistovi, ktorý študuje pevné disky a skúma ich firmvér. Spýtal som sa, aký je princíp, podľa ktorého firmvér zariadenia rozhodne, že teraz je potrebné skryť skutočnosť preradenia sektora, ale teraz o tom môžete hovoriť prostredníctvom atribútov SMART.

Odpovedal, že neexistuje žiadne všeobecné pravidlo, podľa ktorého zariadenia zobrazujú alebo skrývajú skutočný obraz. A logika programátorov, ktorí píšu firmvér pre pevné disky, niekedy vyzerá veľmi zvláštne. Pri štúdiu firmvéru rôznych modelov zistil, že rozhodnutie „skryť alebo zobraziť“ sa často robí na základe súboru parametrov, ktoré sú vo všeobecnosti nejasné, ako súvisia navzájom a so zostávajúcim zdrojom pevného disku.

3) Interpretácia indikátorov SMART závisí od dodávateľa.

Napríklad na Seagates by ste nemali venovať pozornosť „zlým“ nespracovaným hodnotám atribútov 1 a 7, pokiaľ sú ostatné normálne. Na diskoch tohto výrobcu sa môžu ich absolútne hodnoty pri bežnom používaní zvýšiť.

Trochu o SMART a monitorovacích nástrojoch

Na posúdenie stavu a zostávajúcej životnosti pevného disku sa v prvom rade odporúča venovať pozornosť parametrom 5, 196, 197, 198. Okrem toho má zmysel zamerať sa na absolútne, hrubé hodnoty, a nie na dané. . Nátlak na atribúty sa môže vykonávať nezrejmými spôsobmi, odlišnými v rôznych algoritmoch a firmvéri.

Vo všeobecnosti medzi špecialistami na ukladanie údajov, keď hovoria o hodnote atribútu, zvyčajne majú na mysli absolútnu hodnotu.

Zdroj: hab.com

Pridať komentár