Sedikit tentang SMART dan utilitas pemantauan

Ada banyak informasi di Internet tentang SMART dan nilai atribut. Namun saya belum menemukan beberapa poin penting yang saya ketahui dari orang-orang yang terlibat dalam studi media penyimpanan.

Ketika saya sekali lagi memberi tahu seorang teman tentang mengapa pembacaan SMART tidak boleh dipercaya tanpa syarat dan mengapa lebih baik tidak menggunakan “monitor SMART” klasik sepanjang waktu, muncul ide di benak saya untuk menuliskan kata-kata yang diucapkan dalam bentuk a kumpulan tesis beserta penjelasannya. Untuk memberikan tautan alih-alih menceritakan kembali setiap saat. Dan untuk membuatnya tersedia untuk khalayak yang lebih luas.

1) Program untuk pemantauan otomatis atribut SMART harus digunakan dengan sangat hati-hati.

Apa yang Anda kenal sebagai atribut SMART tidak disimpan dalam keadaan siap pakai, namun dihasilkan saat Anda memintanya. Mereka dihitung berdasarkan statistik internal yang dikumpulkan dan digunakan oleh firmware drive selama pengoperasian.

Perangkat tidak memerlukan sebagian data ini untuk menyediakan fungsionalitas dasar. Dan itu tidak disimpan, tetapi dihasilkan setiap kali diperlukan. Oleh karena itu, ketika permintaan atribut SMART terjadi, firmware meluncurkan sejumlah besar proses yang diperlukan untuk mendapatkan data yang hilang.

Namun proses ini kurang kompatibel dengan prosedur yang dilakukan saat drive dimuat dengan operasi baca-tulis.

Dalam dunia ideal, hal ini seharusnya tidak menimbulkan masalah. Namun kenyataannya, firmware harddisk ditulis oleh orang biasa. Siapa yang bisa dan memang melakukan kesalahan. Oleh karena itu, jika Anda menanyakan atribut SMART saat perangkat aktif melakukan operasi baca-tulis, kemungkinan terjadi kesalahan akan meningkat secara dramatis. Misalnya, data dalam buffer baca atau tulis pengguna akan rusak.

Pernyataan tentang peningkatan risiko bukanlah kesimpulan teoretis, melainkan observasi praktis. Misalnya, ada bug yang diketahui terjadi pada firmware HDD Samsung 103UI, di mana data pengguna rusak selama proses permintaan atribut SMART.

Oleh karena itu, jangan konfigurasikan pemeriksaan otomatis atribut SMART. Kecuali Anda mengetahui secara pasti bahwa perintah flush cache (Flush Cache) dikeluarkan sebelum ini. Atau, jika Anda tidak dapat melakukannya tanpanya, konfigurasikan pemindaian agar dijalankan sesering mungkin. Di banyak program pemantauan, waktu default antar pemeriksaan adalah sekitar 10 menit. Ini terlalu umum. Meski begitu, pemeriksaan semacam itu bukanlah obat mujarab untuk kegagalan disk yang tidak terduga (obat mujarab hanyalah cadangan). Sekali sehari – menurut saya itu cukup.

Kueri suhu tidak memicu proses penghitungan atribut dan dapat sering dijalankan. Karena bila diterapkan dengan benar, hal ini dilakukan melalui protokol SCT. Melalui SCT, hanya apa yang sudah diketahui yang diberikan. Data ini diperbarui secara otomatis di latar belakang.

2) Data atribut SMART seringkali tidak dapat diandalkan.

Firmware hard drive menunjukkan kepada Anda apa yang seharusnya ditunjukkannya kepada Anda, bukan apa yang sebenarnya terjadi. Contoh paling nyata adalah atribut ke-5, yaitu jumlah sektor yang dipindahkan. Spesialis pemulihan data sangat menyadari bahwa hard drive dapat menunjukkan jumlah realokasi nol pada atribut kelima, meskipun atribut tersebut ada dan terus muncul.

Saya mengajukan pertanyaan kepada seorang spesialis yang mempelajari hard drive dan memeriksa firmware-nya. Saya bertanya apa prinsip yang digunakan oleh firmware perangkat untuk memutuskan bahwa sekarang perlu menyembunyikan fakta penugasan ulang sektor, tetapi sekarang Anda dapat membicarakannya melalui atribut SMART.

Dia menjawab bahwa tidak ada aturan umum mengenai perangkat mana yang menampilkan atau menyembunyikan gambar sebenarnya. Dan logika programmer yang menulis firmware untuk hard drive terkadang terlihat sangat aneh. Mempelajari firmware model yang berbeda, ia melihat bahwa sering kali keputusan untuk "menyembunyikan atau menampilkan" dibuat berdasarkan serangkaian parameter yang umumnya tidak jelas bagaimana hubungannya satu sama lain dan dengan sisa sumber daya hard drive.

3) Interpretasi indikator SMART bersifat spesifik vendor.

Misalnya, di Seagates Anda tidak boleh memperhatikan nilai mentah atribut 1 dan 7 yang “buruk”, selama sisanya normal. Pada disk dari pabrikan ini, nilai absolutnya mungkin meningkat selama penggunaan normal.

Sedikit tentang SMART dan utilitas pemantauan

Untuk menilai kondisi dan sisa masa pakai hard drive, pertama-tama disarankan untuk memperhatikan parameter 5, 196, 197, 198. Selain itu, masuk akal untuk fokus pada nilai absolut dan mentah, dan bukan pada nilai tertentu. . Pemaksaan atribut dapat dilakukan dengan cara yang tidak jelas, berbeda dalam algoritma dan firmware yang berbeda.

Secara umum, di kalangan spesialis penyimpanan data, ketika berbicara tentang nilai suatu atribut, yang mereka maksud biasanya adalah nilai absolut.

Sumber: www.habr.com

Tambah komentar