Lidt om SMART og overvågningsværktøjer

Der er meget information på internettet om SMART og attributværdier. Men jeg er ikke stødt på nogen omtale af flere vigtige punkter, som jeg kender fra folk, der er involveret i studiet af lagringsmedier.

Da jeg endnu en gang fortalte en ven om, hvorfor man ikke ubetinget kan stole på SMART-aflæsninger, og hvorfor det er bedre ikke at bruge klassiske "SMART-monitorer" hele tiden, fik jeg ideen om at skrive ordene ned i form af en sæt af afhandlinger med forklaringer. At give links i stedet for at genfortælle hver gang. Og for at gøre det tilgængeligt for et bredere publikum.

1) Programmer til automatisk overvågning af SMART-attributter bør bruges med stor forsigtighed.

Det, du kender som SMART-attributter, gemmes ikke færdiglavet, men genereres i det øjeblik, du anmoder om dem. De beregnes baseret på interne statistikker, der er akkumuleret og brugt af drevets firmware under drift.

Enheden behøver ikke nogle af disse data for at levere grundlæggende funktionalitet. Og den lagres ikke, men genereres hver gang den er påkrævet. Derfor, når der opstår en anmodning om SMART-attributter, starter firmwaren et stort antal processer, der er nødvendige for at opnå de manglende data.

Men disse processer er dårligt kompatible med de procedurer, der udføres, når drevet er indlæst med læse-skrive-operationer.

I en ideel verden burde dette ikke give problemer. Men i virkeligheden er harddiskens firmware skrevet af almindelige mennesker. Hvem kan og gør fejl. Derfor, hvis du forespørger efter SMART-attributter, mens enheden aktivt udfører læse-skrive-handlinger, øges sandsynligheden for, at noget går galt, dramatisk. For eksempel vil data i brugerens læse- eller skrivebuffer blive beskadiget.

Udsagnet om stigende risici er ikke en teoretisk konklusion, men en praktisk observation. For eksempel er der en kendt fejl, der opstod i firmwaren på HDD Samsung 103UI, hvor brugerdata blev beskadiget under processen med at anmode om SMART-attributter.

Konfigurer derfor ikke automatisk kontrol af SMART-attributter. Medmindre du ved med sikkerhed, at cache flush-kommandoen (Flush Cache) er udstedt før dette. Eller, hvis du ikke kan undvære det, konfigurer scanningen til at køre så sjældent som muligt. I mange overvågningsprogrammer er standardtiden mellem kontroller omkring 10 minutter. Dette er for almindeligt. Alligevel er sådanne kontroller ikke et universalmiddel for uventet diskfejl (et universalmiddel er kun backup). En gang om dagen - jeg synes, det er nok.

Forespørgsel om temperatur udløser ikke attributberegningsprocesser og kan udføres ofte. For når det implementeres korrekt, sker dette gennem SCT-protokollen. Gennem SCT gives kun det, der allerede er kendt, væk. Disse data opdateres automatisk i baggrunden.

2) SMART-attributdata er ofte upålidelige.

Harddiskens firmware viser dig, hvad den mener, den skal vise dig, ikke hvad der rent faktisk sker. Det mest oplagte eksempel er den 5. attribut, antallet af gentildelte sektorer. Datagendannelsesspecialister er godt klar over, at en harddisk kan vise et nul antal af omallokeringer i den femte attribut, selvom de eksisterer og fortsætter med at dukke op.

Jeg stillede et spørgsmål til en specialist, der studerer harddiske og undersøger deres firmware. Jeg spurgte, hvad er princippet, hvorved enhedens firmware beslutter, at nu er det nødvendigt at skjule kendsgerningen om sektoroverdragelse, men nu kan du tale om det gennem SMART-attributter.

Han svarede, at der ikke er nogen generel regel, ifølge hvilken enheder viser eller skjuler det virkelige billede. Og logikken i programmører, der skriver firmware til harddiske, ser nogle gange meget mærkelig ud. Ved at studere firmwaren til forskellige modeller, så han, at beslutningen om at "skjule eller vise" ofte tages baseret på et sæt parametre, der generelt er uklare, hvordan de er relateret til hinanden og til den resterende ressource på harddisken.

3) Fortolkningen af ​​SMART-indikatorer er leverandørspecifik.

For eksempel skal du på Seagates ikke være opmærksom på de "dårlige" råværdier af attribut 1 og 7, så længe resten er normale. På diske fra denne producent kan deres absolutte værdier stige under normal brug.

Lidt om SMART og overvågningsværktøjer

For at vurdere harddiskens tilstand og resterende levetid anbefales det først og fremmest at være opmærksom på parametrene 5, 196, 197, 198. Desuden giver det mening at fokusere på absolutte, rå værdier og ikke på de givne værdier. . Tvang af attributter kan udføres på ikke-indlysende måder, forskellige i forskellige algoritmer og firmware.

Generelt, blandt datalagringsspecialister, når de taler om værdien af ​​en attribut, mener de normalt den absolutte værdi.

Kilde: www.habr.com

Tilføj en kommentar