Saya punya array RAID yang menyedihkan pada kartu 3ware 9650SE-16ML. Yang tidak bisa saya katakan adalah jika saya baru saja mengalami kegagalan double-disk (gelandangan!) Atau jika saya salah membaca. Output relavent /c0 show all
adalah:
Port Status Unit Size Blocks Serial
---------------------------------------------------------------
p0 DEGRADED u0 931.51 GB 1953525168 5QJ07MAH
p1 ECC-ERROR u0 931.51 GB 1953525168 5QJ0DCW9
p2 OK u0 931.51 GB 1953525168 5QJ0DW9C
p3 OK u0 931.51 GB 1953525168 5QJ0CKXJ
Dan kegagalannya adalah (dari show alarms
):
Ctl Date Severity Alarm Message
------------------------------------------------------------------------------
c0 [Sun Nov 20 07:47:23 2011] INFO Rebuild started: unit=0
c0 [Sun Nov 20 08:20:12 2011] ERROR Drive ECC error reported: port=1, unit=0
c0 [Sun Nov 20 08:20:12 2011] ERROR Source drive error occurred: port=1, unit=0
c0 [Sun Nov 20 08:20:12 2011] ERROR Rebuild failed: unit=0
c0 [Sun Nov 20 08:20:12 2011] INFO Rebuild paused: unit=0
Saya pikir apa yang terjadi adalah p0 gagal, dan kemudian p1 mengalami kesalahan ECC (alias, data saya hilang). Tapi ... mungkin tidak? Itu tetap di 97% dibangun kembali, tetapi tidak bisa melewati kesalahan ini.
Sejauh yang saya tahu, admin sebelumnya mematikan verifikasi berkala, yang membuat kami seperti ini. Ini bukan sesuatu yang kebanyakan orang harus khawatirkan dengan 3Ware RAIDs mereka!
Memperbarui
Setelah mengalahkannya selama beberapa hari, saya melakukan bit IgnoreECC dan itu dibangun kembali, tetapi data saya disembunyikan. Kekecewaan.