Se ha identificado incompatibilidad entre las unidades WD SMR y ZFS, lo que puede provocar la pérdida de datos

iXsystems, el desarrollador del proyecto FreeNAS, advertido sobre serios problemas con la compatibilidad ZFS con algunos de los nuevos discos duros WD Red lanzados por Western Digital utilizando tecnología SMR (Shingled Magnetic Recording). En el peor de los casos, el uso de ZFS en unidades problemáticas podría provocar la pérdida de datos.

Surgen problemas con los discos WD Red con capacidades que van de 2 a 6 TB, producidos desde 2018, que utilizan tecnología para grabar DM-SMR (Grabación magnética en tejas administrada por el dispositivo) y estan marcados Etiqueta EFAX (para discos CMR se utiliza el identificador EFRX). Occidente digital señaló el en su blog que los discos WD Red SMR están diseñados para su uso en NAS para hogares y pequeñas empresas, que instalan no más de 8 discos y tienen una carga de 180 TB por año, típica para copias de seguridad y uso compartido de archivos. La generación anterior de discos WD Red y los modelos WD Red con una capacidad de 8 TB o más, así como los discos de las líneas WD Red Pro, WD Gold y WD Ultrastar, continúan fabricándose en base a la tecnología CMR (Grabación Magnética Convencional). y su uso no causa problemas con ZFS.

La esencia de la tecnología SMR es el uso de un cabezal magnético en un disco, cuyo ancho es mayor que el ancho de la pista, lo que conduce a la grabación con una superposición parcial de la pista adyacente, es decir. cualquier regrabación conlleva la necesidad de volver a grabar todo el grupo de pistas. Para optimizar el trabajo con dichas unidades, se utiliza zonificación — el espacio de almacenamiento se divide en zonas que forman grupos de bloques o sectores, en los que sólo se permite la adición secuencial de datos con la actualización de todo el grupo de bloques. En general, las unidades SMR son más eficientes energéticamente, más asequibles y muestran beneficios de rendimiento para escrituras secuenciales, pero se retrasan cuando realizan escrituras aleatorias, incluidas operaciones como la reconstrucción de matrices de almacenamiento.

DM-SMR implica que las operaciones de distribución de datos y zonificación están controladas por el controlador de disco y, para el sistema, dicho disco parece un disco duro clásico que no requiere manipulaciones separadas. DM-SMR utiliza direccionamiento de bloques lógicos indirectos (LBA, Logical Block Addressing), que recuerda al direccionamiento lógico en las unidades SSD. Cada operación de escritura aleatoria requiere una operación de recolección de basura en segundo plano, lo que genera fluctuaciones de rendimiento impredecibles. El sistema puede intentar aplicar optimizaciones a dichos discos, creyendo que los datos se escribirán en el sector especificado, pero en realidad la información emitida por el controlador determina solo la estructura lógica y, de hecho, al distribuir datos, el controlador aplicará su algoritmos propios que tienen en cuenta los datos previamente asignados. Por lo tanto, antes de utilizar discos DM-SMR en un grupo ZFS, se recomienda realizar una operación para ponerlos a cero y restablecerlos a su estado original.

En el análisis de las condiciones en las que surgen los problemas ha participado Western Digital que, junto con iXsystems, está intentando encontrar una solución y preparar una actualización de firmware. Antes de publicar conclusiones sobre cómo solucionar los problemas, está previsto probar las unidades con el nuevo firmware en almacenamientos de alta carga con FreeNAS 11.3 y TrueNAS CORE 12.0. Se afirma que debido a las diferentes interpretaciones de SMR por parte de diferentes fabricantes, algunos tipos de unidades SMR no tienen problemas con ZFS, pero las pruebas realizadas por iXsystems se centran únicamente en verificar las unidades WD Red basadas en tecnología DM-SMR y para SMR. conduce otros fabricantes se requiere investigación adicional.

Actualmente, los problemas con ZFS se han demostrado y repetido en pruebas para al menos unidades WD Red 4TB WD40EFAX con firmware 82.00A82 y manifiesto transición a un estado de falla bajo una carga de escritura alta, por ejemplo, al realizar una reconstrucción del almacenamiento después de agregar una nueva unidad a la matriz (resilvering). Se cree que el problema ocurre en otros modelos WD Red con el mismo firmware. Cuando ocurre un problema, el disco comienza a devolver un código de error IDNF (ID de sector no encontrado) y queda inutilizable, lo que se trata en ZFS como una falla del disco y puede provocar la pérdida de datos almacenados en el disco. Si fallan varios discos, es posible que se pierdan los datos de un vdev o grupo. Cabe señalar que las fallas mencionadas ocurren con bastante poca frecuencia: de aproximadamente mil sistemas FreeNAS Mini vendidos que estaban equipados con discos problemáticos, el problema surgió en condiciones de funcionamiento solo una vez.

Fuente: opennet.ru

Añadir un comentario