关于 SMART 和监控实用程序的一些信息

互联网上有很多关于SMART和属性值的信息。 但我还没有从参与存储介质研究的人那里看到我所知道的几个重要观点。

当我再次向一位朋友讲述为什么 SMART 读数不应该被无条件信任以及为什么最好不要一直使用经典的“SMART 显示器”时,我想到了以一种形式写下所说的话。一套带有解释的论文。 提供链接而不是每次都重述。 并使其可供更广泛的受众使用。

1) 应谨慎使用自动监控 SMART 属性的程序。

您所知道的 SMART 属性并不是现成存储的,而是在您请求时生成的。 它们是根据驱动器固件在运行期间积累和使用的内部统计数据计算的。

该设备不需要其中一些数据来提供基本功能。 并且它不是存储的,而是每次需要时生成的。 因此,当发生对 SMART 属性的请求时,固件会启动获取丢失数据所需的大量进程。

但这些过程与驱动器加载读写操作时执行的过程兼容性很差。

在理想的情况下,这不会造成任何问题。 但实际上,硬盘固件是普通人编写的。 谁可以而且确实会犯错误。 因此,如果在设备主动执行读写操作时查询 SMART 属性,出现问题的可能性会急剧增加。 例如,用户的读或写缓冲区中的数据将被损坏。

关于风险增加的说法不是理论结论,而是实践观察。 例如,三星103UI硬盘的固件中存在一个已知错误,在请求SMART属性的过程中用户数据被损坏。

因此,不要配置SMART属性的自动检查。 除非你确定知道缓存刷新命令(Flush Cache)在此之前发出。 或者,如果您离不开它,请将扫描配置为尽可能少地运行。 在许多监控程序中,检查之间的默认时间约为 10 分钟。 这太常见了。 尽管如此,此类检查并不是解决意外磁盘故障的万能药(万能药只是备份)。 每天一次——我认为已经足够了。

查询温度不会触发属性计算过程,可以频繁执行。 因为如果正确实施,这是通过 SCT 协议完成的。 通过 SCT,只有已知的信息才会被泄露。 该数据在后台自动更新。

2)SMART属性数据往往不可靠。

硬盘固件向您显示它认为应该向您显示的内容,而不是实际发生的情况。 最明显的例子是第五个属性,即重新分配的扇区数。 数据恢复专家非常清楚,硬盘驱动器在第五个属性中可以显示零数量的重新分配,即使它们存在并继续出现。

我向一位研究硬盘并检查其固件的专家提出了一个问题。 我问设备的固件决定现在需要隐藏扇区重新分配的事实的原理是什么,但是现在可以通过SMART属性来谈论它。

他回答说,没有一般规则根据哪些设备显示或隐藏真实图片。 而为硬盘编写固件的程序员的逻辑有时看起来很奇怪。 通过研究不同型号的固件,他发现“隐藏或显示”的决定通常是基于一组参数做出的,这些参数通常不清楚它们之间的关系以及与硬盘驱动器剩余资源的关系。

3) SMART 指标的解释是特定于供应商的。

例如,在希捷上,您不应该关注属性1和7的“坏”原始值,只要其余正常即可。 在该制造商生产的磁盘上,其绝对值在正常使用期间可能会增加。

关于 SMART 和监控实用程序的一些信息

要评估硬盘的状况和剩余寿命,首先建议关注参数 5、196、197、198。此外,关注绝对值、原始值而不是给定值是有意义的。 属性的强制可以以非显而易见的方式执行,在不同的算法和固件中有所不同。

一般来说,在数据存储专家中,当他们谈论属性的值时,他们通常指的是绝对值。

来源: habr.com

添加评论