Una mica sobre SMART i les utilitats de supervisió

Hi ha molta informació a Internet sobre SMART i valors d'atributs. Però no he trobat cap menció de diversos punts importants que conec per part de persones implicades en l'estudi dels suports d'emmagatzematge.

Quan vaig tornar a dir-li a un amic per què no s'ha de confiar incondicionalment en les lectures SMART i per què és millor no utilitzar els clàssics "monitors SMART" tot el temps, em va venir la idea d'escriure les paraules pronunciades en forma de conjunt de tesis amb explicacions. Per proporcionar enllaços en comptes de tornar a explicar-ho cada cop. I per posar-lo a l'abast d'un públic més ampli.

1) Els programes per al control automàtic dels atributs SMART s'han d'utilitzar amb molta precaució.

El que coneixeu com a atributs SMART no s'emmagatzemen ja fets, sinó que es generen en el moment que els sol·liciteu. Es calculen a partir de les estadístiques internes acumulades i utilitzades pel microprogramari de la unitat durant el funcionament.

El dispositiu no necessita algunes d'aquestes dades per oferir una funcionalitat bàsica. I no s'emmagatzema, sinó que es genera cada vegada que es requereix. Per tant, quan es produeix una sol·licitud d'atributs SMART, el microprogramari llança un gran nombre de processos necessaris per obtenir les dades que falten.

Però aquests processos són poc compatibles amb els procediments que es realitzen quan la unitat es carrega amb operacions de lectura i escriptura.

En un món ideal, això no hauria de causar cap problema. Però en realitat, el microprogramari del disc dur està escrit per gent normal. Qui pot cometre errors i ho fa. Per tant, si consulteu els atributs SMART mentre el dispositiu està realitzant activament operacions de lectura i escriptura, la probabilitat que alguna cosa vagi malament augmenta dràsticament. Per exemple, les dades de la memòria intermèdia de lectura o escriptura de l'usuari es corrompran.

L'afirmació sobre l'augment dels riscos no és una conclusió teòrica, sinó una observació pràctica. Per exemple, hi ha un error conegut que es va produir al microprogramari de l'HDD Samsung 103UI, on les dades de l'usuari es van danyar durant el procés de sol·licitud d'atributs SMART.

Per tant, no configureu la comprovació automàtica dels atributs SMART. A menys que sàpigues amb certesa que l'ordre d'eliminació de la memòria cau (Flush Cache) s'emet abans. O, si no podeu prescindir d'ell, configureu l'exploració perquè s'executi tan rarament com sigui possible. En molts programes de monitorització, el temps predeterminat entre comprovacions és d'uns 10 minuts. Això és massa comú. Tot i així, aquestes comprovacions no són una panacea per a fallades inesperades del disc (una panacea només és una còpia de seguretat). Un cop al dia, crec que n'hi ha prou.

La consulta de temperatura no activa els processos de càlcul d'atributs i es pot executar amb freqüència. Perquè quan s'implementa correctament, això es fa mitjançant el protocol SCT. Mitjançant l'SCT només es regala allò que ja es coneix. Aquestes dades s'actualitzen automàticament en segon pla.

2) Les dades d'atributs SMART sovint no són fiables.

El microprogramari del disc dur us mostra el que creu que us hauria de mostrar, no el que està passant realment. L'exemple més evident és el 5è atribut, el nombre de sectors reassignats. Els especialistes en recuperació de dades són ben conscients que un disc dur pot mostrar un nombre zero de reassignacions en el cinquè atribut, tot i que existeixen i continuen apareixent.

Vaig fer una pregunta a un especialista que estudia els discs durs i examina el seu microprogramari. Vaig preguntar quin és el principi pel qual el firmware del dispositiu decideix que ara cal ocultar el fet de la reassignació del sector, però ara podeu parlar-ne a través d'atributs SMART.

Va respondre que no hi ha cap regla general segons la qual els dispositius mostrin o amaguen la imatge real. I la lògica dels programadors que escriuen firmware per a discs durs de vegades sembla molt estranya. Estudiant el microprogramari de diferents models, va veure que sovint la decisió d'"amagar o mostrar" es pren en funció d'un conjunt de paràmetres que generalment no tenen clar com es relacionen entre si i amb el recurs restant del disc dur.

3) La interpretació dels indicadors SMART és específica del proveïdor.

Per exemple, a Seagates no hauríeu de prestar atenció als valors bruts "dolents" dels atributs 1 i 7, sempre que la resta sigui normal. Als discs d'aquest fabricant, els seus valors absoluts poden augmentar durant l'ús normal.

Una mica sobre SMART i les utilitats de supervisió

Per avaluar l'estat i la vida restant del disc dur, primer es recomana prestar atenció als paràmetres 5, 196, 197, 198. A més, té sentit centrar-se en els valors absoluts, en brut, i no en els donats. . La coacció d'atributs es pot dur a terme de maneres no òbvies, diferents en diferents algorismes i firmware.

En general, entre els especialistes en emmagatzematge de dades, quan parlen del valor d'un atribut, solen referir-se al valor absolut.

Font: www.habr.com

Afegeix comentari