Iets over SMART en monitoringhulpprogramma's

Er is veel informatie op internet over SMART en attribuutwaarden. Maar ik ben geen enkele vermelding tegengekomen van een aantal belangrijke punten die ik ken van mensen die betrokken zijn bij de studie van opslagmedia.

Toen ik een vriend opnieuw vertelde waarom SMART-metingen niet onvoorwaardelijk vertrouwd mogen worden en waarom het beter is om niet altijd klassieke “SMART-monitoren” te gebruiken, kwam het idee bij mij op om de gesproken woorden op te schrijven in de vorm van een set scripties met uitleg. Om links aan te bieden in plaats van elke keer opnieuw te vertellen. En om het beschikbaar te maken voor een breder publiek.

1) Programma's voor het automatisch monitoren van SMART-attributen moeten met grote voorzichtigheid worden gebruikt.

Wat u kent als SMART-attributen worden niet kant-en-klaar opgeslagen, maar gegenereerd op het moment dat u ze opvraagt. Ze worden berekend op basis van interne statistieken die zijn verzameld en gebruikt door de firmware van de schijf tijdens bedrijf.

Het apparaat heeft een deel van deze gegevens niet nodig om basisfunctionaliteit te bieden. En het wordt niet opgeslagen, maar gegenereerd elke keer dat het nodig is. Daarom start de firmware, wanneer er een verzoek om SMART-attributen plaatsvindt, een groot aantal processen die nodig zijn om de ontbrekende gegevens te verkrijgen.

Maar deze processen zijn slecht compatibel met de procedures die worden uitgevoerd wanneer de schijf wordt geladen met lees-schrijfbewerkingen.

In een ideale wereld zou dit geen problemen moeten opleveren. Maar in werkelijkheid wordt de firmware voor de harde schijf door gewone mensen geschreven. Wie fouten kan en zal maken. Als u daarom SMART-kenmerken opvraagt ​​terwijl het apparaat actief lees- en schrijfbewerkingen uitvoert, neemt de kans dat er iets misgaat dramatisch toe. Gegevens in de lees- of schrijfbuffer van de gebruiker zullen bijvoorbeeld beschadigd raken.

De uitspraak over toenemende risico’s is geen theoretische conclusie, maar een praktische observatie. Er is bijvoorbeeld een bekende bug opgetreden in de firmware van HDD Samsung 103UI, waarbij gebruikersgegevens beschadigd raakten tijdens het aanvragen van SMART-attributen.

Configureer daarom geen automatische controle van SMART-attributen. Tenzij je zeker weet dat het cache flush-commando (Flush Cache) daarvoor wordt gegeven. Of, als u niet zonder kunt, configureert u de scan zo zelden mogelijk. In veel monitoringprogramma's bedraagt ​​de standaardtijd tussen controles ongeveer 10 minuten. Dit komt te vaak voor. Toch zijn dergelijke controles geen wondermiddel voor onverwachte schijfstoringen (een wondermiddel is alleen een back-up). Eén keer per dag – ik denk dat het voldoende is.

Het opvragen van de temperatuur activeert geen attribuutberekeningsprocessen en kan regelmatig worden uitgevoerd. Want als het correct wordt geïmplementeerd, gebeurt dit via het SCT-protocol. Via SCT wordt alleen datgene wat al bekend is weggegeven. Deze gegevens worden automatisch op de achtergrond bijgewerkt.

2) SMART-attribuutgegevens zijn vaak onbetrouwbaar.

De firmware van de harde schijf laat u zien wat hij denkt dat hij u zou moeten laten zien, niet wat er feitelijk gebeurt. Het meest voor de hand liggende voorbeeld is het vijfde attribuut, het aantal opnieuw toegewezen sectoren. Specialisten op het gebied van dataherstel zijn zich er terdege van bewust dat een harde schijf in het vijfde kenmerk een nulaantal herlocaties kan vertonen, ook al bestaan ​​ze en blijven ze verschijnen.

Ik stelde een vraag aan een specialist die harde schijven bestudeert en hun firmware onderzoekt. Ik vroeg wat het principe is waarmee de firmware van het apparaat besluit dat het nu nodig is om het feit van sectorhertoewijzing te verbergen, maar nu kun je erover praten via SMART-attributen.

Hij antwoordde dat er geen algemene regel bestaat volgens welke apparaten het echte beeld tonen of verbergen. En de logica van programmeurs die firmware voor harde schijven schrijven ziet er soms heel vreemd uit. Toen hij de firmware van verschillende modellen bestudeerde, zag hij dat de beslissing om 'verbergen of tonen' vaak wordt genomen op basis van een reeks parameters waarvan over het algemeen onduidelijk is hoe ze zich tot elkaar verhouden en tot de resterende bron van de harde schijf.

3) De interpretatie van SMART-indicatoren is leverancierspecifiek.

Op Seagates moet je bijvoorbeeld geen aandacht besteden aan de ‘slechte’ ruwe waarden van attributen 1 en 7, zolang de rest maar normaal is. Op schijven van deze fabrikant kunnen hun absolute waarden bij normaal gebruik toenemen.

Iets over SMART en monitoringhulpprogramma's

Om de staat en de resterende levensduur van de harde schijf te beoordelen, wordt allereerst aanbevolen om aandacht te besteden aan de parameters 5, 196, 197, 198. Bovendien is het logisch om zich te concentreren op absolute, ruwe waarden, en niet op de gegeven waarden. . Dwang van attributen kan op niet voor de hand liggende manieren worden uitgevoerd, verschillend in verschillende algoritmen en firmware.

Over het algemeen bedoelen dataopslagspecialisten, als ze het hebben over de waarde van een attribuut, meestal de absolute waarde.

Bron: www.habr.com

Voeg een reactie