Identificouse a incompatibilidade entre as unidades WD SMR e ZFS, o que pode provocar a perda de datos

iXsystems, o desenvolvedor do proxecto FreeNAS, avisou sobre problemas graves coa compatibilidade de ZFS con algúns dos novos discos duros WD Red lanzados por Western Digital mediante a tecnoloxía SMR (Shingled Magnetic Recording). No peor dos casos, o uso de ZFS en unidades problemáticas pode provocar a perda de datos.

Os problemas xorden coas unidades WD Red con capacidades que van de 2 a 6 TB, producidas desde 2018, que utilizan tecnoloxía para gravar DM-SMR (Gravación magnética con tellas xestionada por dispositivo) e están marcados Etiqueta EFAX (para discos CMR utilízase o identificador EFRX). Western Digital observou o no seu blog que as unidades WD Red SMR están deseñadas para o seu uso en NAS para o fogar e as pequenas empresas, que non instalan máis de 8 unidades e teñen unha carga de 180 TB ao ano, típica para facer copias de seguridade e compartir ficheiros. A xeración anterior de unidades WD Red e modelos WD Red cunha capacidade de 8 TB ou máis, así como as unidades das liñas WD Red Pro, WD Gold e WD Ultrastar, seguen fabricándose baseándose na tecnoloxía CMR (Grabación Magnética Convencional). e o seu uso non causa problemas con ZFS.

A esencia da tecnoloxía SMR é o uso dun cabezal magnético nun disco, cuxo ancho é maior que o ancho da pista, o que leva á gravación con superposición parcial da pista adxacente, é dicir. calquera regravación resulta na necesidade de volver gravar todo o grupo de pistas. Para optimizar o traballo con tales unidades, úsase zoneamento — o espazo de almacenamento divídese en zonas que forman grupos de bloques ou sectores, nas que só se permite a adición secuencial de datos coa actualización de todo o grupo de bloques. En xeral, as unidades SMR son máis eficientes enerxéticamente, máis asequibles e mostran beneficios de rendemento para as escrituras secuenciais, pero van atrasando cando se realizan escrituras aleatorias, incluídas operacións como a reconstrución de matrices de almacenamento.

DM-SMR implica que as operacións de zonificación e distribución de datos están controladas polo controlador de disco e, para o sistema, ese disco parece un disco duro clásico que non require manipulacións separadas. DM-SMR usa o enderezo de bloques lóxicos indirectos (LBA, Logical Block Addressing), que lembra o enderezo lóxico nas unidades SSD. Cada operación de escritura aleatoria require unha operación de recollida de lixo en segundo plano, o que provoca flutuacións de rendemento impredicibles. O sistema pode intentar aplicar optimizacións a tales discos, crendo que os datos se escribirán no sector especificado, pero de feito a información emitida polo controlador determina só a estrutura lóxica e, de feito, ao distribuír datos, o controlador aplicará a súa algoritmos propios que teñan en conta datos previamente asignados. Polo tanto, antes de utilizar os discos DM-SMR nun grupo ZFS, recoméndase realizar unha operación para cero e restablecelos ao seu estado orixinal.

Western Digital participou na análise das condicións nas que xorden os problemas que, xunto con iXsystems, trata de buscar unha solución e preparar unha actualización de firmware. Antes de publicar conclusións sobre a solución dos problemas, está previsto que as unidades co novo firmware sexan probadas en almacenamentos de alta carga con FreeNAS 11.3 e TrueNAS CORE 12.0. Indícase que, debido ás diferentes interpretacións de SMR por parte dos diferentes fabricantes, algúns tipos de unidades SMR non teñen problemas con ZFS, pero as probas realizadas por iXsystems céntranse só na comprobación das unidades WD Red baseadas na tecnoloxía DM-SMR, e para SMR. unidades outros fabricantes requírese investigación adicional.

Actualmente, os problemas con ZFS foron probados e repetidos en probas para polo menos unidades WD Red 4TB WD40EFAX con firmware 82.00A82 e manifesto transición a un estado de fallo con alta carga de escritura, por exemplo, cando se realiza unha reconstrución de almacenamento despois de engadir unha nova unidade á matriz (recuperación de prata). Crese que o problema ocorre noutros modelos WD Red co mesmo firmware. Cando se produce un problema, o disco comeza a devolver un código de erro IDNF (Sector ID Not Found) e pasa a ser inservible, o que se trata en ZFS como un fallo do disco e pode provocar a perda de datos almacenados no disco. Se fallan varios discos, é posible que se perdan os datos dun vdev ou dun grupo. Nótese que os fallos mencionados ocorren moi raramente: duns mil sistemas FreeNAS Mini vendidos que estaban equipados con discos problemáticos, o problema xurdiu en condicións de traballo só unha vez.

Fonte: opennet.ru

Engadir un comentario