Un pouco sobre SMART e utilidades de monitorización

Hai moita información en Internet sobre SMART e valores de atributos. Pero non atopei ningunha mención de varios puntos importantes que coñeza por parte de persoas implicadas no estudo dos medios de almacenamento.

Cando volvía a dicirlle a un amigo por que non se debe confiar incondicionalmente nas lecturas SMART e por que é mellor non usar os clásicos "monitores SMART" todo o tempo, xurdínme a idea de escribir as palabras que se dicían en forma de conxunto de teses con explicacións. Para proporcionar ligazóns en lugar de repetir cada vez. E para poñelo a disposición dun público máis amplo.

1) Os programas para o seguimento automático dos atributos SMART deben usarse con moito coidado.

Os que coñeces como atributos SMART non se almacenan xa feitos, senón que se xeran no momento en que os solicitas. Calcúlanse en función das estatísticas internas acumuladas e utilizadas polo firmware da unidade durante o funcionamento.

O dispositivo non precisa algúns destes datos para proporcionar unha funcionalidade básica. E non se almacena, senón que se xera cada vez que se require. Polo tanto, cando se produce unha solicitude de atributos SMART, o firmware inicia un gran número de procesos que son necesarios para obter os datos que faltan.

Pero estes procesos son pouco compatibles cos procedementos realizados cando a unidade está cargada con operacións de lectura e escritura.

Nun mundo ideal, isto non debería causar ningún problema. Pero en realidade, o firmware do disco duro está escrito por persoas comúns. Quen pode e fai erros. Polo tanto, se consultas atributos SMART mentres o dispositivo realiza activamente operacións de lectura e escritura, a probabilidade de que algo saia mal aumenta drasticamente. Por exemplo, os datos do búfer de lectura ou escritura do usuario estarán corrompidos.

A afirmación sobre o aumento dos riscos non é unha conclusión teórica, senón unha observación práctica. Por exemplo, hai un erro coñecido que ocorreu no firmware do HDD Samsung 103UI, onde os datos do usuario foron danados durante o proceso de solicitude de atributos SMART.

Polo tanto, non configure a comprobación automática dos atributos SMART. A non ser que estea seguro de que o comando de vaciado da caché (Flush Cache) se emitiu antes. Ou, se non pode prescindir del, configure a exploración para que se execute o menos posible. En moitos programas de vixilancia, o tempo predeterminado entre comprobacións é duns 10 minutos. Isto é demasiado común. De todos os xeitos, tales comprobacións non son unha panacea para fallos inesperados do disco (unha panacea é só unha copia de seguridade). Unha vez ao día, creo que é suficiente.

A consulta de temperatura non desencadea procesos de cálculo de atributos e pódese executar con frecuencia. Porque cando se implementa correctamente, isto faise a través do protocolo SCT. A través do SCT só se regala o que xa se sabe. Estes datos actualízanse automaticamente en segundo plano.

2) Os datos de atributos SMART adoitan ser pouco fiables.

O firmware do disco duro móstrache o que pensa que debería mostrarche, non o que está a suceder en realidade. O exemplo máis obvio é o quinto atributo, o número de sectores reasignados. Os especialistas en recuperación de datos saben ben que un disco duro pode mostrar un número cero de reasignacións no quinto atributo, aínda que existen e seguen aparecendo.

Fíxenlle unha pregunta a un especialista que estuda os discos duros e examina o seu firmware. Pregunteille cal é o principio polo cal o firmware do dispositivo decide que agora é necesario ocultar o feito da reasignación do sector, pero agora podes falar diso a través de atributos SMART.

El respondeu que non existe unha norma xeral segundo a cal os dispositivos mostren ou oculten a imaxe real. E a lóxica dos programadores que escriben firmware para discos duros ás veces parece moi estraña. Ao estudar o firmware de diferentes modelos, viu que moitas veces a decisión de "ocultar ou mostrar" tómase en función dun conxunto de parámetros que xeralmente non están claros como se relacionan entre si e co recurso restante do disco duro.

3) A interpretación dos indicadores SMART é específica do provedor.

Por exemplo, en Seagates non debes prestar atención aos valores brutos "malos" dos atributos 1 e 7, sempre que o resto sexa normal. Nos discos deste fabricante, os seus valores absolutos poden aumentar durante o uso normal.

Un pouco sobre SMART e utilidades de monitorización

Para avaliar o estado e a vida útil restante do disco duro, recoméndase en primeiro lugar prestar atención aos parámetros 5, 196, 197, 198. Ademais, ten sentido centrarse nos valores absolutos e brutos e non nos dados. . A coacción dos atributos pódese realizar de xeitos non obvios, diferentes en diferentes algoritmos e firmware.

En xeral, entre os especialistas en almacenamento de datos, cando falan do valor dun atributo, adoitan significar o valor absoluto.

Fonte: www.habr.com

Engadir un comentario