Kami memiliki server linux yang telah banyak digunakan selama 3 tahun. Kami menjalankan sejumlah server tervirtualisasi di atasnya, beberapa di antaranya tidak berperilaku baik, dan untuk waktu yang signifikan kapasitas io server terlampaui yang mengarah ke iowait buruk. Itu punya 4 500GB Barracuda sata drive terhubung ke pengontrol serangan 3com. 1 Drive memiliki OS, dan 3 lainnya adalah setup raid-5.
Sekarang kami memiliki perdebatan mengenai kondisi drive dan apakah mereka gagal secara aktif.
Berikut adalah sebagian dari output untuk 1 dari 4 disk. Mereka semua memiliki statistik yang relatif sama:
Nomor revisi Struktur Data Atribut SMART: 10 Atribut SMART Khusus Vendor dengan Ambang: ID # ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE TERBARU WHEN_FAILED RAW_VALUE 1 Raw_Read_Error_Rate 0x000f 118 099 006 Selalu Gagal - 169074425 3 Spin_Up_Time 0x0003 095 092 000 Selalu gagal - 0 4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 26 5 Reallocated_Sector_Ct 0x0033 100 100 036 Pra-gagal Selalu - 0 7 Seek_Error_Rate 0x000f 077 060 030 Selalu Gagal - 200009354607 9 Power_On_Hours 0x0032 069 069 000 Old_age Selalu - 27856 10 Spin_Retry_Count 0x0013 100 100 097 Pra-gagal Selalu - 1 12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always - 26 184 Unknown_Attribute 0x0032 100 100 099 Old_age Always - 0 187 Dilaporkan Tidak Benar 0x0032 100 100 000 Old_age Selalu - 0 188 Unknown_Attribute 0x0032 100 100 000 Old_age Always - 1 189 High_Fly_Writes 0x003a 100 100 000 Old_age Selalu - 0 190 Airflow_Temperature_Cel 0x0022 071 060 045 Old_age Always - 29 (Lifetime Min / Max 26/37) 194 Temperature_Celsius 0x0022 029 040 000 Old_age Always - 29 (0 21 0 0) 195 Hardware_ECC_Recovered 0x001a 046 033 000 Old_age Always - 169074425 197 Current_Pending_Sector 0x0012 100 100 000 Old_age Selalu - 0 198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0 199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Selalu - 0 Versi Log Kesalahan SMART: 1 Tidak Ada Kesalahan yang Dicatat
Interpretasi saya terhadap hal ini adalah bahwa kami belum memiliki sektor yang buruk atau indikasi lain bahwa ada drive yang gagal aktif.
Namun, Raw_Read_Error_Rate dan Seek_Error_Rate yang tinggi sedang ditunjukkan sebagai indikasi bahwa drive sedang sekarat.