Un po' di SMART e delle utilità di monitoraggio

Ci sono molte informazioni su Internet su SMART e sui valori degli attributi. Ma non ho trovato alcuna menzione di alcuni punti importanti di cui sono a conoscenza da parte di persone coinvolte nello studio dei supporti di memorizzazione.

Quando ancora una volta raccontavo a un amico perché non ci si dovrebbe fidare incondizionatamente delle letture SMART e perché è meglio non usare sempre i classici “monitor SMART”, mi è venuta l'idea di scrivere le parole pronunciate sotto forma di serie di tesi con spiegazioni. Per fornire collegamenti invece di raccontarli ogni volta. E per renderlo disponibile a un pubblico più ampio.

1) I programmi per il monitoraggio automatico degli attributi SMART dovrebbero essere usati con molta cautela.

Quelli che conosci come attributi SMART non vengono memorizzati già pronti, ma vengono generati nel momento in cui li richiedi. Vengono calcolati in base alle statistiche interne accumulate e utilizzate dal firmware dell'unità durante il funzionamento.

Il dispositivo non ha bisogno di alcuni di questi dati per fornire funzionalità di base. E non viene memorizzato, ma viene generato ogni volta che è richiesto. Pertanto, quando si verifica una richiesta di attributi SMART, il firmware avvia un gran numero di processi necessari per ottenere i dati mancanti.

Ma questi processi sono scarsamente compatibili con le procedure eseguite quando l'unità viene caricata con operazioni di lettura-scrittura.

In un mondo ideale, ciò non dovrebbe causare alcun problema. Ma in realtà il firmware del disco rigido è scritto da persone comuni. Chi può e commette errori. Pertanto, se si eseguono query sugli attributi SMART mentre il dispositivo sta eseguendo attivamente operazioni di lettura-scrittura, la probabilità che qualcosa vada storto aumenta notevolmente. Ad esempio, i dati nel buffer di lettura o scrittura dell'utente verranno danneggiati.

L'affermazione sull'aumento dei rischi non è una conclusione teorica, ma un'osservazione pratica. Ad esempio, esiste un bug noto che si è verificato nel firmware dell'HDD Samsung 103UI, in cui i dati dell'utente venivano danneggiati durante il processo di richiesta degli attributi SMART.

Pertanto non configurare il controllo automatico degli attributi SMART. A meno che tu non sappia con certezza che il comando di svuotamento della cache (Flush Cache) viene eseguito prima di questo. Oppure, se non puoi farne a meno, configura la scansione in modo che venga eseguita il più raramente possibile. In molti programmi di monitoraggio, il tempo predefinito tra i controlli è di circa 10 minuti. Questo è troppo comune. Tuttavia, tali controlli non sono una panacea per guasti imprevisti del disco (la panacea è solo il backup). Una volta al giorno – penso che sia abbastanza.

L'interrogazione della temperatura non attiva processi di calcolo degli attributi e può essere eseguita frequentemente. Perché se implementato correttamente, ciò avviene tramite il protocollo SCT. Attraverso SCT si regala solo ciò che è già noto. Questi dati vengono aggiornati automaticamente in background.

2) I dati degli attributi SMART sono spesso inaffidabili.

Il firmware del disco rigido mostra ciò che pensa di dover mostrare, non ciò che sta realmente accadendo. L'esempio più ovvio è il quinto attributo, il numero di settori riassegnati. Gli specialisti del recupero dati sanno bene che un disco rigido può mostrare un numero zero di riallocazioni nel quinto attributo, anche se esistono e continuano ad apparire.

Ho posto una domanda a uno specialista che studia i dischi rigidi ed esamina il loro firmware. Ho chiesto qual è il principio con cui il firmware del dispositivo decide che ora è necessario nascondere il fatto della riassegnazione del settore, ma ora se ne può parlare tramite attributi SMART.

Ha risposto che non esiste una regola generale secondo cui i dispositivi mostrano o nascondono l'immagine reale. E la logica dei programmatori che scrivono firmware per dischi rigidi a volte sembra molto strana. Studiando il firmware di diversi modelli, ha visto che spesso la decisione di "nascondere o mostrare" viene presa sulla base di una serie di parametri, generalmente poco chiari su come siano correlati tra loro e con la risorsa rimanente del disco rigido.

3) L'interpretazione degli indicatori SMART dipende dal fornitore.

Ad esempio, su Seagates non dovresti prestare attenzione ai valori grezzi "cattivi" degli attributi 1 e 7, purché il resto sia normale. Sui dischi di questo produttore, i loro valori assoluti possono aumentare durante il normale utilizzo.

Un po' di SMART e delle utilità di monitoraggio

Per valutare le condizioni e la durata residua del disco rigido, si consiglia innanzitutto di prestare attenzione ai parametri 5, 196, 197, 198. Inoltre, ha senso concentrarsi sui valori assoluti e grezzi e non su quelli indicati . La coercizione degli attributi può essere eseguita in modi non ovvi, diversi in diversi algoritmi e firmware.

In generale, tra gli specialisti dell'archiviazione dati, quando si parla del valore di un attributo, si intende solitamente il valore assoluto.

Fonte: habr.com

Aggiungi un commento