Малко за SMART и помощните програми за наблюдение

В интернет има много информация за SMART и стойностите на атрибутите. Но не съм срещал никакво споменаване на няколко важни точки, за които знам от хора, участващи в изучаването на носители за съхранение.

Когато за пореден път разказвах на приятел защо на SMART показанията не трябва да се вярва безусловно и защо е по-добре да не се използват постоянно класическите „SMART монитори“, ми хрумна идеята да запиша изречените думи под формата на набор от тези с обяснения. Да се ​​дават линкове вместо всеки път да се преразказва. И да го направи достъпен за по-широка публика.

1) Програмите за автоматично наблюдение на SMART атрибути трябва да се използват с голямо внимание.

Това, което познавате като SMART атрибути, не се съхранява готово, а се генерира в момента, в който ги поискате. Те се изчисляват въз основа на вътрешна статистика, натрупана и използвана от фърмуера на устройството по време на работа.

Устройството не се нуждае от някои от тези данни, за да осигури основна функционалност. И не се съхранява, а се генерира всеки път, когато е необходимо. Следователно, когато възникне заявка за SMART атрибути, фърмуерът стартира голям брой процеси, които са необходими за получаване на липсващите данни.

Но тези процеси са слабо съвместими с процедурите, изпълнявани, когато устройството е заредено с операции за четене и запис.

В един идеален свят това не би трябвало да създава проблеми. Но в действителност фърмуерът на твърдия диск се пише от обикновени хора. Който може и прави грешки. Следователно, ако заявите SMART атрибути, докато устройството активно извършва операции за четене и запис, вероятността нещо да се обърка се увеличава драстично. Например данните в буфера за четене или запис на потребителя ще бъдат повредени.

Твърдението за нарастващи рискове не е теоретично заключение, а практическо наблюдение. Например, има известен бъг, възникнал във фърмуера на HDD Samsung 103UI, където потребителските данни бяха повредени по време на процеса на заявяване на SMART атрибути.

Следователно не конфигурирайте автоматична проверка на SMART атрибути. Освен ако не знаете със сигурност, че командата за изчистване на кеша (Flush Cache) е издадена преди това. Или, ако не можете без него, конфигурирайте сканирането да се изпълнява възможно най-рядко. В много програми за мониторинг времето по подразбиране между проверките е около 10 минути. Това е твърде често. Все пак такива проверки не са панацея за неочаквана повреда на диска (панацеята е само архивиране). Веднъж на ден - мисля, че е напълно достатъчно.

Запитването за температура не задейства процеси за изчисляване на атрибути и може да се изпълнява често. Защото, когато се внедри правилно, това става чрез SCT протокола. Чрез SCT се раздава само това, което вече е известно. Тези данни се актуализират автоматично във фонов режим.

2) Данните за атрибутите SMART често са ненадеждни.

Фърмуерът на твърдия диск ви показва това, което смята, че трябва да ви покаже, а не какво всъщност се случва. Най-очевидният пример е петият атрибут, броят на преназначените сектори. Специалистите по възстановяване на данни са наясно, че твърдият диск може да покаже нулев брой преразпределения в петия атрибут, въпреки че те съществуват и продължават да се появяват.

Зададох въпрос на специалист, който изучава твърди дискове и изследва техния фърмуер. Попитах какъв е принципът, по който фърмуерът на устройството решава, че сега е необходимо да се скрие фактът на преназначаване на сектора, но сега можете да говорите за това чрез SMART атрибути.

Той отговори, че няма общо правило, според което устройствата показват или скриват реалната картина. И логиката на програмистите, които пишат фърмуер за твърди дискове, понякога изглежда много странна. Изучавайки фърмуера на различни модели, той видя, че често решението за „скриване или показване“ се взема въз основа на набор от параметри, които като цяло са неясни как са свързани помежду си и с оставащия ресурс на твърдия диск.

3) Интерпретацията на SMART индикаторите е специфична за доставчика.

Например, на Seagates не трябва да обръщате внимание на „лошите“ сурови стойности на атрибути 1 и 7, стига останалите да са нормални. На дискове от този производител техните абсолютни стойности могат да се увеличат при нормална употреба.

Малко за SMART и помощните програми за наблюдение

За да оцените състоянието и оставащия живот на твърдия диск, първо се препоръчва да обърнете внимание на параметри 5, 196, 197, 198. Освен това има смисъл да се съсредоточите върху абсолютни, сурови стойности, а не върху дадените . Принудяването на атрибути може да се извърши по неочевидни начини, различни в различните алгоритми и фърмуер.

По принцип сред специалистите по съхранение на данни, когато говорят за стойността на даден атрибут, те обикновено имат предвид абсолютната стойност.

Източник: www.habr.com

Добавяне на нов коментар