Bug de firmware do SSD HPE causando perda de dados após 32768 horas de operação

Hewlett Packard Enterprise publicado Atualização de firmware para unidades SAS vendidas sob a marca HPE. A atualização resolve um problema crítico que faz com que todos os dados sejam perdidos devido a uma falha após 32768 horas de operação da unidade (3 anos, 270 dias e 8 horas). O problema aparece em versões de firmware até HPD8. Após atualizar o firmware, não é necessário reiniciar o servidor.

Até que esse tempo passe, o problema não aparece, mas todos os usuários de SSD HPE SAS são aconselhados a não atrasar a substituição do firmware. Se o firmware não for atualizado, após o tempo de operação especificado do SSD, todos os dados serão perdidos para sempre e a unidade se tornará inadequada para uso posterior. Uma situação particularmente desagradável pode surgir ao usar unidades SSD em matrizes RAID - se as unidades forem adicionadas ao mesmo tempo, todas falharão ao mesmo tempo.

O problema afeta 20 modelos de unidades SSD SAS fornecidos com servidores e sistemas de armazenamento HPE ProLiant, Synergy, Apollo, JBOD D3xxx, D6xxx, D8xxx, MSA, StoreVirtual 4335 e StoreVirtual 3200. Os produtos 3PAR, Nimble, Simplivity, XP e Primera não são afetados pelo problema. Kit de ferramentas de atualização de firmware preparado para Linux, Windows e VMware ESXi, mas até agora a atualização foi publicada apenas para alguns dos dispositivos problemáticos e, para o restante, é esperada para 9 de dezembro. Você pode estimar quanto tempo a unidade funcionou depois de olhar Valor "Power On Hours" no relatório do Smart Storage Administrator, que pode ser gerado com o comando "ssa -diag -f report.txt".

O erro foi identificado por um fornecedor terceirizado envolvido na produção de SSDs para a HPE. É possível que o problema não se limite à HPE e afete outros fabricantes que trabalham com este contratante (o contratante não é identificado e não é detalhado quem cometeu o erro - o contratante ou os engenheiros da HPE). Sete anos atrás, os SSDs Crucial M4 tinham identificado um erro semelhante que fez com que a unidade ficasse indisponível após 5184 horas de operação.
Este ano, a Intel também lançou uma atualização de firmware para SSD D3-S4510/D3-S4610 de 1.92 TB e 3.84 TB, eliminando problema de inoperabilidade após 1700 horas de operação.

Fonte: opennet.ru

Adicionar um comentário