Un poco sobre SMART y las utilidades de monitoreo

Hay mucha información en Internet sobre SMART y los valores de atributos. Pero no he encontrado ninguna mención de varios puntos importantes que conozco por parte de personas involucradas en el estudio de los medios de almacenamiento.

Cuando una vez más le conté a un amigo por qué no se debe confiar incondicionalmente en las lecturas SMART y por qué es mejor no usar los "monitores SMART" clásicos todo el tiempo, se me ocurrió la idea de escribir las palabras pronunciadas en forma de conjunto de tesis con explicaciones. Proporcionar enlaces en lugar de volver a contarlos cada vez. Y ponerlo a disposición de un público más amplio.

1) Los programas para el seguimiento automático de atributos SMART deben utilizarse con mucha precaución.

Los atributos SMART no se almacenan ya preparados, sino que se generan en el momento en que los solicita. Se calculan en función de las estadísticas internas acumuladas y utilizadas por el firmware de la unidad durante el funcionamiento.

El dispositivo no necesita algunos de estos datos para proporcionar una funcionalidad básica. Y no se almacena, sino que se genera cada vez que se requiere. Por lo tanto, cuando se produce una solicitud de atributos SMART, el firmware inicia una gran cantidad de procesos necesarios para obtener los datos faltantes.

Pero estos procesos son poco compatibles con los procedimientos realizados cuando la unidad está cargada con operaciones de lectura y escritura.

En un mundo ideal, esto no debería causar ningún problema. Pero, en realidad, el firmware del disco duro lo escribe gente corriente. ¿Quién puede y comete errores? Por lo tanto, si consulta los atributos SMART mientras el dispositivo realiza activamente operaciones de lectura y escritura, la probabilidad de que algo salga mal aumenta drásticamente. Por ejemplo, los datos en el búfer de lectura o escritura del usuario se dañarán.

La afirmación sobre el aumento de los riesgos no es una conclusión teórica, sino una observación práctica. Por ejemplo, hay un error conocido que ocurrió en el firmware del HDD Samsung 103UI, donde los datos del usuario se dañaron durante el proceso de solicitud de atributos SMART.

Por lo tanto, no configure la verificación automática de los atributos SMART. A menos que esté seguro de que el comando de vaciado de caché (Flush Cache) se emite antes de esto. O, si no puede prescindir de él, configure el análisis para que se ejecute lo menos posible. En muchos programas de seguimiento, el tiempo predeterminado entre comprobaciones es de unos 10 minutos. Esto es demasiado común. De todos modos, estas comprobaciones no son una panacea para fallos inesperados del disco (una panacea es sólo una copia de seguridad). Una vez al día, creo que es suficiente.

La consulta de temperatura no activa procesos de cálculo de atributos y se puede ejecutar con frecuencia. Porque cuando se implementa correctamente, esto se hace a través del protocolo SCT. A través de la SCT sólo se regala lo que ya se sabe. Estos datos se actualizan automáticamente en segundo plano.

2) Los datos de atributos SMART a menudo no son confiables.

El firmware del disco duro le muestra lo que cree que debería mostrarle, no lo que realmente está sucediendo. El ejemplo más obvio es el quinto atributo, el número de sectores reasignados. Los especialistas en recuperación de datos saben muy bien que un disco duro puede mostrar un número cero de reasignaciones en el quinto atributo, aunque existan y sigan apareciendo.

Le hice una pregunta a un especialista que estudia discos duros y examina su firmware. Pregunté cuál es el principio por el cual el firmware del dispositivo decide que ahora es necesario ocultar el hecho de la reasignación del sector, pero ahora puedes hablar de ello a través de atributos SMART.

Respondió que no existe una regla general según la cual los dispositivos muestran u ocultan la imagen real. Y la lógica de los programadores que escriben firmware para discos duros a veces parece muy extraña. Al estudiar el firmware de diferentes modelos, vio que a menudo la decisión de "ocultar o mostrar" se toma en función de un conjunto de parámetros que generalmente no están claros en cómo se relacionan entre sí y con el recurso restante del disco duro.

3) La interpretación de los indicadores SMART es específica del proveedor.

Por ejemplo, en Seagates no debes prestar atención a los valores brutos "malos" de los atributos 1 y 7, siempre que el resto sea normal. En los discos de este fabricante, sus valores absolutos pueden aumentar durante el uso normal.

Un poco sobre SMART y las utilidades de monitoreo

Para evaluar el estado y la vida útil restante del disco duro, se recomienda en primer lugar prestar atención a los parámetros 5, 196, 197, 198. Además, tiene sentido centrarse en valores absolutos y sin procesar, y no en los dados. . La coerción de atributos se puede realizar de formas no obvias, diferentes en diferentes algoritmos y firmware.

Por lo general, entre los especialistas en almacenamiento de datos, cuando hablan del valor de un atributo, suelen referirse al valor absoluto.

Fuente: habr.com

Añadir un comentario