Error en el firmware de HPE SSD que causa pérdida de datos después de 32768 horas de funcionamiento

Empresa Hewlett Packard опубликовала Actualización de firmware para unidades SAS vendidas bajo la marca HPE. La actualización resuelve un problema crítico que provoca la pérdida de todos los datos debido a una falla después de 32768 horas de funcionamiento de la unidad (3 años, 270 días y 8 horas). El problema aparece en versiones de firmware hasta HPD8. Después de actualizar el firmware, no es necesario reiniciar el servidor.

Hasta que pase este tiempo, el problema no aparece, pero se recomienda a todos los usuarios de HPE SAS SSD que no demoren en reemplazar el firmware. Si el firmware no se actualiza, después del tiempo de funcionamiento especificado del SSD, todos los datos se perderán para siempre y la unidad dejará de ser adecuada para su uso posterior. Puede surgir una situación particularmente desagradable al utilizar unidades SSD en matrices RAID: si las unidades se agregan al mismo tiempo, todas fallarán al mismo tiempo.

El problema afecta a 20 modelos de unidades SSD SAS enviadas con servidores y sistemas de almacenamiento HPE ProLiant, Synergy, Apollo, JBOD D3xxx, D6xxx, D8xxx, MSA, StoreVirtual 4335 y StoreVirtual 3200. Los productos 3PAR, Nimble, Simplivity, XP y Primera no se ven afectados por el problema. Kit de herramientas de actualización de firmware preparado para Linux, Windows y VMware ESXi, pero hasta ahora la actualización se ha publicado solo para algunos de los dispositivos problemáticos, y para el resto se espera para el 9 de diciembre. Puede estimar cuánto tiempo ha funcionado ya el disco. después de mirar Valor de "Horas de encendido" en el informe de Smart Storage Administrator, que se puede generar con el comando "ssa -diag -f report.txt".

El error fue identificado por un contratista externo que participaba en la producción de SSD para HPE. Es posible que el problema no se limite a HPE y afecte a otros fabricantes que trabajan con este contratista (no se nombra al contratista y no se detalla quién cometió el error: el contratista o los ingenieros de HPE). Hace siete años, los SSD Crucial M4 tenían identificado un error similar que provocó que la unidad no estuviera disponible después de 5184 horas de funcionamiento.
Este año, Intel también lanzó una actualización de firmware para SSD D3-S4510/D3-S4610 de 1.92 TB y 3.84 TB. eliminando problema de inoperabilidad después de 1700 horas de funcionamiento.

Fuente: opennet.ru

Añadir un comentario