Трохі аб SMART і ўтылітах для маніторынгу

У сетцы дастаткова шмат інфармацыі аб SMART і значэннях атрыбутаў. Але мне не сустракаліся згадкі аб некалькіх важных момантах, пра якія ведаю ад людзей, якія займаюцца даследаваннем носьбітаў інфармацыі.

Калі я ў чарговы раз расказваў знаёмаму аб тым, чаму паказанням SMART не варта безумоўна верыць і чаму лепш не выкарыстоўваць класічныя "маніторылкі СМАРТа" пастаянна, прыйшла ў галаву ідэя запісаць сказаныя словы ў выглядзе набору тэзісаў з тлумачэннямі. Каб даваць спасылкі, замест таго, каб кожны раз пераказваць. І для азнаямлення шырокай аўдыторыі.

1) Праграмамі для аўтаматычнага маніторынгу атрыбутаў SMART трэба карыстацца з вялікай асцярогай.

Тое, што вы ведаеце як атрыбуты SMART, не захоўваецца ў гатовым выглядзе, а генеруецца ў той момант, калі вы іх запытваеце. Вылічаюцца яны на аснове ўнутранай статыстыкі, якая назапашваецца і выкарыстоўванай мікрапраграмай назапашвальніка падчас прац.

Частка гэтых дадзеных прыладзе для забеспячэння асноўнага функцыяналу не патрэбна. І яна не захоўваецца, а фармуецца кожны раз, калі патрабуецца. Таму, калі адбываецца запыт атрыбутаў SMART, мікрапраграма запускае вялікую колькасць працэсаў, якія патрэбныя для атрымання якія адсутнічаюць дадзеных.

Але гэтыя працэсы дрэнна сумяшчальныя з працэдурамі, якія выконваюцца пры нагрузцы назапашвальніка аперацыямі чытання-запісы.

У ідэальным свеце, гэта не павінна было б прыводзіць да якіх-небудзь праблем. Але ў рэальнасці, прашыўкі цвёрдых кружэлак пішуць звычайныя людзі. Якія могуць памыляцца і памыляюцца. Таму, калі вы запытваеце атрыбуты SMART падчас актыўнага выканання прыладай аперацый чытання-запісы, то рэзка ўзрастае верагоднасць таго, што нешта пайдзе не так. Напрыклад, будуць пашкоджаны дадзеныя ў карыстацкім буферы чытання ці запісы.

Сцвярджэнне аб узрастанні рызык - гэта не тэарэтычнае выснова, а практычнае назіранне. Да прыкладу, вядомы баг, які меў месца ў прашыўцы HDD Samsung 103UI, дзе падчас выкананні запыту атрыбутаў SMART, пашкоджваліся карыстацкія дадзеныя.

Таму, не настройвайце аўтаматычную праверку атрыбутаў SMART. Калі толькі сапраўды не ведаеце, што перад гэтым падаецца каманда скіду кэша (Flush Cache). Ці, калі без гэтага не абысціся, настройвайце выкананне праверкі максімальна рэдка. У многіх праграмах маніторынгу, настроены па змаўчанні час паміж праверкамі – каля 10 хвілін. Гэта занадта часта. Усё роўна такія праверкі панацэяй ад нечаканага выхаду дыска са строю не з'яўляюцца (панацэя - толькі рэзерваванне). Раз у суткі - лічу цалкам дастатковым.

Запыт тэмпературы да запуску працэсаў вылічэння атрыбутаў не прыводзіць і можа выконвацца часта. Паколькі пры правільнай рэалізацыі гэта выконваецца праз пратакол SCT. Праз SCT аддаецца толькі тое, што ўжо вядома. Гэтыя дадзеныя абнаўляюцца аўтаматычна ў фонавым рэжыме.

2) Дадзеныя атрыбутаў SMART часта недакладныя.

Мікрапраграма цвёрдай кружэлкі паказвае вам тое, што лічыць патрэбным паказаць, а не тое, што ў рэчаіснасці адбываецца. Найбольш наглядны прыклад, гэта 5-ы атрыбут, колькасць пераназначаных сектараў. Адмыслоўцам па ўзнаўленні дадзеных добра вядома, што цвёрдая кружэлка можа ў пятым атрыбуце паказваць нулявую колькасць рэалакейтаў, пры тым, што яны ёсць і працягваюць з'яўляцца.

Я задаў пытанне адмыслоўцу, які вывучае цвёрдыя кружэлкі і што даследуе іх мікрапраграмы. Пацікавіўся, які прынцып, па якім прашыўка прылады вырашае, што вось зараз трэба хаваць факт перапрызначэння сектараў, а зараз можна расказваць пра гэта праз атрыбуты SMART.

Ён адказаў, што агульнага правіла, паводле якога прылады паказваюць ці хаваюць рэальную карціну не існуе. І логіка праграмістаў, якія пішуць прашыўкі жорсткіх дыскаў, часам выглядае вельмі дзіўна. Вывучаючы прашыўкі розных мадэляў ён убачыў, што часцяком рашэнне "схаваць ці паказаць" прымаецца на аснове набору параметраў, якія наогул незразумела як звязаныя паміж сабой і з рэшткавым рэсурсам цвёрдай кружэлкі.

3) Інтэрпрэтацыя паказчыкаў SMART вендар-спецыфічная.

Напрыклад, на Сігейтах не варта зважаць на "дрэнныя" raw значэнні атрыбутаў 1 і 7, пакуль астатнія ў норме. На дысках гэтага вытворцы, іх абсалютныя значэнні могуць павялічвацца падчас звычайнай эксплуатацыі.

Трохі аб SMART і ўтылітах для маніторынгу

Для адзнакі стану і рэшткавага рэсурсу цвёрдай кружэлкі, у першую чаргу рэкамендуецца зважаць на параметры 5, 196, 197, 198. Прычым, арыентавацца мае сэнс менавіта на абсалютныя, волкія значэнні (raw), а не на прыведзеныя. Прывядзенне атрыбутаў можа выконвацца невідавочнымі спосабамі, рознымі ў розных алгарытмах і прашыўках.

Наогул, у асяроддзі адмыслоўцаў па носьбітах інфармацыі, калі кажуць пра значэнне атрыбута, звычайна маецца на ўвазе менавіта абсалютнае значэнне.

Крыніца: habr.com

Дадаць каментар