Bug del firmware SSD HPE che causa la perdita di dati dopo 32768 ore di funzionamento

Hewlett Packard Enterprise pubblicato Aggiornamento firmware per le unità SAS vendute con il marchio HPE. L'aggiornamento risolve un problema critico che causa la perdita di tutti i dati a causa di un arresto anomalo dopo 32768 ore di funzionamento dell'unità (3 anni, 270 giorni e 8 ore). Il problema si presenta nelle versioni firmware fino a HPD8. Dopo l'aggiornamento del firmware, non è necessario riavviare il server.

Fino a quando non sarà trascorso questo tempo, il problema non si presenterà, ma si consiglia a tutti gli utenti SSD HPE SAS di non ritardare la sostituzione del firmware. Se il firmware non viene aggiornato, dopo il tempo di funzionamento specificato dell'SSD tutti i dati andranno persi per sempre e l'unità diventerà inadatta per un ulteriore utilizzo. Una situazione particolarmente spiacevole può verificarsi quando si utilizzano unità SSD in array RAID: se le unità vengono aggiunte contemporaneamente, si guasteranno tutte contemporaneamente.

Il problema riguarda 20 modelli di unità SSD SAS fornite con server e sistemi di storage HPE ProLiant, Synergy, Apollo, JBOD D3xxx, D6xxx, D8xxx, MSA, StoreVirtual 4335 e StoreVirtual 3200. I prodotti 3PAR, Nimble, Simplivity, XP e Primera non sono interessati. dal problema. Kit di strumenti per l'aggiornamento del firmware preparato per Linux, Windows e VMware ESXi, ma l'aggiornamento finora è stato pubblicato solo per alcuni dispositivi problematici, per il resto è atteso per il 9 dicembre. È possibile stimare per quanto tempo l'unità ha già funzionato dopo aver guardato Valore "Ore di accensione" nel report Smart Storage Administrator, che può essere generato con il comando "ssa -diag -f report.txt".

L'errore è stato identificato da un appaltatore terzo coinvolto nella produzione di SSD per HPE. È possibile che il problema non sia limitato a HPE e riguardi altri produttori che lavorano con questo appaltatore (l'appaltatore non è nominato e non è specificato chi ha commesso l'errore: l'appaltatore o gli ingegneri HPE). Sette anni fa, gli SSD Crucial M4 avevano identificato un errore simile che ha reso l'unità non disponibile dopo 5184 ore di funzionamento.
Quest'anno, Intel ha rilasciato anche un aggiornamento firmware per SSD D3-S4510/D3-S4610 da 1.92 TB e 3.84 TB, eliminando problema di inoperabilità dopo 1700 ore di funzionamento.

Fonte: opennet.ru

Aggiungi un commento