Un peu sur SMART et les utilitaires de surveillance

Il existe de nombreuses informations sur Internet sur SMART et les valeurs d'attribut. Mais je n'ai rencontré aucune mention de plusieurs points importants que je connais de la part des personnes impliquées dans l'étude des supports de stockage.

Alors que j'expliquais une fois de plus à un ami pourquoi il ne fallait pas faire confiance inconditionnellement aux lectures SMART et pourquoi il était préférable de ne pas utiliser tout le temps les « moniteurs SMART » classiques, l'idée m'est venue d'écrire les mots prononcés sous la forme d'un ensemble de thèses avec explications. Fournir des liens au lieu de raconter à chaque fois. Et de le rendre accessible à un public plus large.

1) Les programmes de surveillance automatique des attributs SMART doivent être utilisés avec une grande prudence.

Ce que vous appelez les attributs SMART ne sont pas stockés prêts à l'emploi, mais sont générés au moment où vous les demandez. Ils sont calculés sur la base de statistiques internes accumulées et utilisées par le micrologiciel du lecteur pendant le fonctionnement.

L'appareil n'a pas besoin de certaines de ces données pour fournir les fonctionnalités de base. Et il n'est pas stocké, mais est généré à chaque fois que cela est nécessaire. Par conséquent, lorsqu'une demande d'attributs SMART se produit, le micrologiciel lance un grand nombre de processus nécessaires pour obtenir les données manquantes.

Mais ces processus sont peu compatibles avec les procédures effectuées lorsque le lecteur est chargé d'opérations de lecture-écriture.

Dans un monde idéal, cela ne devrait poser aucun problème. Mais en réalité, le firmware du disque dur est écrit par des gens ordinaires. Qui peut faire et fait des erreurs. Par conséquent, si vous interrogez les attributs SMART alors que l'appareil effectue activement des opérations de lecture-écriture, la probabilité qu'un problème se produise augmente considérablement. Par exemple, les données du tampon de lecture ou d'écriture de l'utilisateur seront corrompues.

L’affirmation sur l’augmentation des risques n’est pas une conclusion théorique, mais une observation pratique. Par exemple, il existe un bug connu survenu dans le micrologiciel du disque dur Samsung 103UI, où les données utilisateur ont été endommagées lors du processus de demande d'attributs SMART.

Par conséquent, ne configurez pas la vérification automatique des attributs SMART. Sauf si vous savez avec certitude que la commande de vidage du cache (Flush Cache) est émise avant cela. Ou, si vous ne pouvez pas vous en passer, configurez l'analyse pour qu'elle s'exécute aussi rarement que possible. Dans de nombreux programmes de surveillance, le délai par défaut entre les vérifications est d'environ 10 minutes. C'est trop courant. Néanmoins, de telles vérifications ne sont pas une panacée en cas de panne de disque inattendue (une panacée n'est qu'une sauvegarde). Une fois par jour – je pense que c’est largement suffisant.

L'interrogation de la température ne déclenche pas de processus de calcul d'attribut et peut être exécutée fréquemment. Parce que lorsqu'il est correctement mis en œuvre, cela se fait via le protocole SCT. Grâce au SCT, seul ce qui est déjà connu est divulgué. Ces données sont mises à jour automatiquement en arrière-plan.

2) Les données d'attribut SMART sont souvent peu fiables.

Le micrologiciel du disque dur vous montre ce qu'il pense devoir vous montrer, et non ce qui se passe réellement. L'exemple le plus évident est le 5ème attribut, le nombre de secteurs réaffectés. Les spécialistes de la récupération de données savent bien qu'un disque dur peut afficher un nombre nul de réallocations dans le cinquième attribut, même si elles existent et continuent d'apparaître.

J'ai posé une question à un spécialiste qui étudie les disques durs et examine leur firmware. J'ai demandé quel est le principe par lequel le micrologiciel de l'appareil décide qu'il est désormais nécessaire de cacher le fait de la réaffectation de secteur, mais vous pouvez désormais en parler via les attributs SMART.

Il a répondu qu'il n'y a pas de règle générale selon laquelle les appareils affichent ou masquent l'image réelle. Et la logique des programmeurs qui écrivent des firmwares pour disques durs semble parfois très étrange. En étudiant le firmware de différents modèles, il a constaté que souvent la décision de « masquer ou afficher » est prise sur la base d'un ensemble de paramètres dont on ne sait généralement pas comment ils sont liés les uns aux autres et à la ressource restante du disque dur.

3) L'interprétation des indicateurs SMART est spécifique au fournisseur.

Par exemple, sur Seagates, vous ne devez pas faire attention aux « mauvaises » valeurs brutes des attributs 1 et 7, tant que le reste est normal. Sur les disques de ce fabricant, leurs valeurs absolues peuvent augmenter lors d'une utilisation normale.

Un peu sur SMART et les utilitaires de surveillance

Pour évaluer l'état et la durée de vie restante du disque dur, il est tout d'abord recommandé de faire attention aux paramètres 5, 196, 197, 198. De plus, il est logique de se concentrer sur les valeurs absolues et brutes, et non sur celles données. . La coercition des attributs peut être effectuée de manière non évidente, différente selon les algorithmes et les micrologiciels.

En général, parmi les spécialistes du stockage de données, lorsqu'ils parlent de la valeur d'un attribut, ils entendent généralement la valeur absolue.

Source: habr.com

Ajouter un commentaire