Foi identificada incompatibilidade entre unidades WD SMR e ZFS, o que pode levar à perda de dados

iXsystems, desenvolvedor do projeto FreeNAS, avisado sobre sérios problemas de compatibilidade do ZFS com alguns dos novos discos rígidos WD Red lançados pela Western Digital usando a tecnologia SMR (Shingled Magnetic Recording). Na pior das hipóteses, usar o ZFS em unidades problemáticas pode resultar em perda de dados.

Surgem problemas com unidades WD Red com capacidades que variam de 2 a 6 TB, produzidas desde 2018, que utilizam tecnologia para gravação DM-SMR (gravação magnética shingled gerenciada por dispositivo) e estão marcados Etiqueta EFAX (para discos CMR é usado o identificador EFRX). Digital ocidental observou o em seu blog que as unidades WD Red SMR são projetadas para uso em NAS para residências e pequenas empresas, que instalam no máximo 8 unidades e têm uma carga de 180 TB por ano, típica para backup e compartilhamento de arquivos. A geração anterior de unidades WD Red e modelos WD Red com capacidade de 8 TB ou mais, bem como unidades das linhas WD Red Pro, WD Gold e WD Ultrastar, continuam a ser fabricadas com base na tecnologia CMR (Gravação Magnética Convencional). e seu uso não causa problemas com o ZFS.

A essência da tecnologia SMR é a utilização de uma cabeça magnética em um disco, cuja largura é maior que a largura da trilha, o que leva à gravação com sobreposição parcial da trilha adjacente, ou seja, qualquer regravação resulta na necessidade de regravar todo o grupo de faixas. Para otimizar o trabalho com tais unidades, é usado zoneamento — o espaço de armazenamento é dividido em zonas que constituem grupos de blocos ou setores, nos quais só é permitida a adição sequencial de dados com atualização de todo o grupo de blocos. Em geral, as unidades SMR são mais eficientes em termos energéticos, mais acessíveis e apresentam benefícios de desempenho para gravações sequenciais, mas apresentam atraso ao executar gravações aleatórias, incluindo operações como a reconstrução de matrizes de armazenamento.

DM-SMR implica que as operações de zoneamento e distribuição de dados são controladas pelo controlador de disco e para o sistema tal disco se parece com um disco rígido clássico que não requer manipulações separadas. DM-SMR usa endereçamento indireto de bloco lógico (LBA, Logical Block Addressing), que lembra o endereçamento lógico em unidades SSD. Cada operação de gravação aleatória requer uma operação de coleta de lixo em segundo plano, resultando em flutuações imprevisíveis de desempenho. O sistema pode tentar aplicar otimizações a tais discos, acreditando que os dados serão gravados no setor especificado, mas na verdade a informação emitida pelo controlador determina apenas a estrutura lógica e de fato, ao distribuir os dados, o controlador aplicará seu algoritmos próprios que levam em consideração dados previamente alocados. Portanto, antes de usar discos DM-SMR em um pool ZFS, é recomendado realizar uma operação para zerá-los e redefini-los para seu estado original.

A Western Digital tem estado envolvida na análise das condições em que surgem os problemas, que, em conjunto com a iXsystems, está a tentar encontrar uma solução e preparar uma atualização de firmware. Antes de publicar conclusões sobre como corrigir os problemas, as unidades com o novo firmware estão planejadas para serem testadas em armazenamentos de alta carga com FreeNAS 11.3 e TrueNAS CORE 12.0. Afirma-se que devido a diferentes interpretações de SMR por diferentes fabricantes, alguns tipos de unidades SMR não apresentam problemas com ZFS, mas os testes realizados pela iXsystems se concentram apenas na verificação de unidades WD Red baseadas na tecnologia DM-SMR, e para SMR unidades outros fabricantes pesquisas adicionais são necessárias.

Atualmente, problemas com ZFS foram comprovados e repetidos em testes para pelo menos unidades WD Red 4TB WD40EFAX com firmware 82.00A82 e aparecer transição para um estado de falha sob alta carga de gravação, por exemplo, ao executar uma reconstrução de armazenamento após adicionar uma nova unidade ao array (resilvering). Acredita-se que o problema ocorra em outros modelos WD Red com o mesmo firmware. Quando ocorre um problema, o disco começa a retornar um código de erro IDNF (Sector ID Not Found) e fica inutilizável, o que é tratado no ZFS como uma falha de disco e pode levar à perda de dados armazenados no disco. Se vários discos falharem, os dados em um vdev ou pool poderão ser perdidos. Observa-se que as falhas mencionadas ocorrem muito raramente - entre cerca de mil sistemas FreeNAS Mini vendidos equipados com discos problemáticos, o problema surgiu apenas uma vez em condições de trabalho.

Fonte: opennet.ru

Adicionar um comentário