Câteva despre SMART și utilitățile de monitorizare

Există o mulțime de informații pe Internet despre SMART și valorile atributelor. Dar nu am întâlnit nicio mențiune despre câteva puncte importante despre care știu de la oameni implicați în studiul mediilor de stocare.

Când îi spuneam încă o dată unui prieten de ce citirile SMART nu ar trebui să fie necondiționat de încredere și de ce este mai bine să nu folosesc „monitoarele SMART” clasice tot timpul, mi-a venit ideea să notez cuvintele rostite sub forma unui set de teze cu explicatii. Pentru a oferi link-uri în loc să repovesti de fiecare dată. Și pentru a-l pune la dispoziția unui public mai larg.

1) Programele pentru monitorizarea automată a atributelor SMART trebuie utilizate cu mare prudență.

Ceea ce știți ca atribute SMART nu sunt stocate gata făcute, ci sunt generate în momentul în care le solicitați. Acestea sunt calculate pe baza statisticilor interne acumulate și utilizate de firmware-ul unității în timpul funcționării.

Dispozitivul nu are nevoie de unele dintre aceste date pentru a oferi funcționalitate de bază. Și nu este stocat, ci este generat de fiecare dată când este necesar. Prin urmare, atunci când apare o solicitare pentru atribute SMART, firmware-ul lansează un număr mare de procese care sunt necesare pentru a obține datele lipsă.

Dar aceste procese sunt slab compatibile cu procedurile efectuate atunci când unitatea este încărcată cu operații de citire-scriere.

Într-o lume ideală, acest lucru nu ar trebui să creeze probleme. Dar, în realitate, firmware-ul hard disk-ului este scris de oameni obișnuiți. Cine poate și face greșeli. Prin urmare, dacă interogați atributele SMART în timp ce dispozitivul efectuează în mod activ operațiuni de citire-scriere, probabilitatea ca ceva să nu meargă greșit crește dramatic. De exemplu, datele din memoria tampon de citire sau scriere a utilizatorului vor fi corupte.

Afirmația despre creșterea riscurilor nu este o concluzie teoretică, ci o observație practică. De exemplu, există o eroare cunoscută care a apărut în firmware-ul HDD-ului Samsung 103UI, în care datele utilizatorului au fost deteriorate în timpul procesului de solicitare a atributelor SMART.

Prin urmare, nu configurați verificarea automată a atributelor SMART. Cu excepția cazului în care știți cu siguranță că comanda de golire a cache (Flush Cache) este emisă înainte de aceasta. Sau, dacă nu puteți face fără ea, configurați scanarea să ruleze cât mai rar posibil. În multe programe de monitorizare, timpul implicit între verificări este de aproximativ 10 minute. Acest lucru este prea comun. Totuși, astfel de verificări nu sunt un panaceu pentru defecțiunile neașteptate ale discului (un panaceu este doar redundanță). O dată pe zi – cred că este destul.

Interogarea temperaturii nu declanșează procesele de calcul al atributelor și poate fi executată frecvent. Pentru că atunci când este implementat corect, acest lucru se face prin protocolul SCT. Prin SCT se dă deoparte doar ceea ce se știe deja. Aceste date sunt actualizate automat în fundal.

2) Datele atributelor SMART sunt adesea nesigure.

Firmware-ul hard disk-ului vă arată ceea ce crede că ar trebui să vă arate, nu ceea ce se întâmplă de fapt. Cel mai evident exemplu este al 5-lea atribut, numărul de sectoare reatribuite. Specialiștii în recuperarea datelor știu bine că un hard disk poate afișa un număr zero de realocări în al cincilea atribut, chiar dacă acestea există și continuă să apară.

Am pus o întrebare unui specialist care studiază hard disk-urile și le examinează firmware-ul. Am întrebat care este principiul prin care firmware-ul dispozitivului decide că acum este necesar să ascunzi faptul reatribuirii sectorului, dar acum poți vorbi despre asta prin atributele SMART.

El a răspuns că nu există o regulă generală conform căreia dispozitivele arată sau ascunde imaginea reală. Iar logica programatorilor care scriu firmware pentru hard disk-uri pare uneori foarte ciudată. Studiind firmware-ul diferitelor modele, el a văzut că de multe ori decizia de a „ascunde sau arăta” se ia pe baza unui set de parametri care, în general, sunt neclari cum sunt relaționați unul cu celălalt și cu resursa rămasă a hard disk-ului.

3) Interpretarea indicatorilor SMART este specifică furnizorului.

De exemplu, pe Seagates nu ar trebui să acordați atenție valorilor brute „rele” ale atributelor 1 și 7, atâta timp cât restul sunt normale. Pe discurile de la acest producător, valorile lor absolute pot crește în timpul utilizării normale.

Câteva despre SMART și utilitățile de monitorizare

Pentru a evalua starea și durata de viață rămasă a hard disk-ului, se recomandă în primul rând să acordați atenție parametrilor 5, 196, 197, 198. Mai mult, este logic să vă concentrați pe valorile absolute, brute, și nu pe cele date. . Coercirea atributelor poate fi efectuată în moduri neevidente, diferite în diferiți algoritmi și firmware.

În general, printre specialiștii în stocarea datelor, atunci când vorbesc despre valoarea unui atribut, se referă de obicei la valoarea absolută.

Sursa: www.habr.com

Adauga un comentariu