Litt om SMART og overvåkingsverktøy

Det er mye informasjon på Internett om SMART og attributtverdier. Men jeg har ikke kommet over noen omtale av flere viktige punkter som jeg vet om fra folk som er involvert i studiet av lagringsmedier.

Da jeg nok en gang fortalte en venn om hvorfor SMART-avlesninger ikke skulle være ubetinget klarert og hvorfor det er bedre å ikke bruke klassiske "SMART-skjermer" hele tiden, kom ideen til meg å skrive ned ordene som ble sagt i form av en sett med avhandlinger med forklaringer. Å gi lenker i stedet for å gjenfortelle hver gang. Og for å gjøre den tilgjengelig for et bredere publikum.

1) Programmer for automatisk overvåking av SMART-attributter bør brukes med stor forsiktighet.

Det du kjenner som SMART-attributter lagres ikke ferdiglagde, men genereres i det øyeblikket du ber om dem. De beregnes basert på intern statistikk akkumulert og brukt av stasjonens fastvare under drift.

Enheten trenger ikke noen av disse dataene for å gi grunnleggende funksjonalitet. Og den lagres ikke, men genereres hver gang den er nødvendig. Derfor, når en forespørsel om SMART-attributter oppstår, starter fastvaren et stort antall prosesser som er nødvendige for å få tak i de manglende dataene.

Men disse prosessene er dårlig kompatible med prosedyrene som utføres når stasjonen er lastet med lese-skriveoperasjoner.

I en ideell verden burde dette ikke forårsake noen problemer. Men i virkeligheten er harddiskens fastvare skrevet av vanlige mennesker. Hvem kan og gjør feil. Derfor, hvis du spør etter SMART-attributter mens enheten aktivt utfører lese-skriveoperasjoner, øker sannsynligheten for at noe går galt dramatisk. For eksempel vil data i brukerens lese- eller skrivebuffer bli ødelagt.

Utsagnet om økende risiko er ikke en teoretisk konklusjon, men en praktisk observasjon. For eksempel er det en kjent feil som oppsto i fastvaren til HDD Samsung 103UI, der brukerdata ble skadet under prosessen med å be om SMART-attributter.

Konfigurer derfor ikke automatisk kontroll av SMART-attributter. Med mindre du vet sikkert at cache flush-kommandoen (Flush Cache) er utstedt før dette. Eller, hvis du ikke klarer deg uten den, konfigurer skanningen til å kjøre så sjelden som mulig. I mange overvåkingsprogrammer er standardtiden mellom kontrollene omtrent 10 minutter. Dette er for vanlig. Likevel er slike kontroller ikke et universalmiddel for uventet diskfeil (et universalmiddel er bare sikkerhetskopiering). En gang om dagen - jeg tror det er nok.

Spørring av temperatur utløser ikke attributtberegningsprosesser og kan utføres ofte. For når det implementeres riktig, gjøres dette gjennom SCT-protokollen. Gjennom SCT gis bare det som allerede er kjent bort. Disse dataene oppdateres automatisk i bakgrunnen.

2) SMART-attributtdata er ofte upålitelige.

Harddiskens fastvare viser deg hva den mener den skal vise deg, ikke hva som faktisk skjer. Det mest åpenbare eksemplet er den 5. attributten, antall omtilordnede sektorer. Datagjenopprettingsspesialister er godt klar over at en harddisk kan vise et null antall omfordelinger i den femte attributten, selv om de eksisterer og fortsetter å vises.

Jeg stilte et spørsmål til en spesialist som studerer harddisker og undersøker fastvaren deres. Jeg spurte hva er prinsippet som enhetens fastvare bestemmer at nå er det nødvendig å skjule faktumet om sektortildeling, men nå kan du snakke om det gjennom SMART-attributter.

Han svarte at det ikke er noen generell regel om hvilke enheter som viser eller skjuler det virkelige bildet. Og logikken til programmerere som skriver fastvare for harddisker ser noen ganger veldig merkelig ut. Ved å studere fastvaren til forskjellige modeller, så han at beslutningen om å "skjule eller vise" ofte tas basert på et sett med parametere som generelt er uklare hvordan de er relatert til hverandre og til den gjenværende ressursen på harddisken.

3) Tolkningen av SMART-indikatorer er leverandørspesifikk.

For eksempel, på Seagates bør du ikke ta hensyn til de "dårlige" råverdiene til attributtene 1 og 7, så lenge resten er normale. På disker fra denne produsenten kan deres absolutte verdier øke under normal bruk.

Litt om SMART og overvåkingsverktøy

For å vurdere tilstanden og gjenværende levetid på harddisken, anbefales det først og fremst å ta hensyn til parameterne 5, 196, 197, 198. Dessuten er det fornuftig å fokusere på absolutte, rå verdier, og ikke på de gitte. . Tvang av attributter kan utføres på ikke-opplagte måter, forskjellige i forskjellige algoritmer og fastvare.

Generelt, blant datalagringsspesialister, når de snakker om verdien av et attributt, mener de vanligvis den absolutte verdien.

Kilde: www.habr.com

Legg til en kommentar