Jika Anda punya waktu, baca Pinheiro et al (2007) Tren Kegagalan dalam Populasi Drive Disk yang Besar. Prosiding Konferensi USENIX ke-5 tentang Teknologi File dan Penyimpanan, Februari 2007 . Itu dapat diambil dari http://static.googleusercontent.com/external_content/untrusted_dlcp/labs.google.com/en//papers/disk_failures.pdf
Secara umum, drive dari pabrikan yang sama dibuat dengan spesifikasi yang sama dalam hal rakitan disk. Biasanya toleransi yang berbeda. Sebagai contoh, jika Anda menginginkan lingkaran kertas berdiameter 5cm, lingkaran 4,5 atau 5,5 cm mungkin dapat diterima untuk sekali pakai (mis. Digunakan di rumah untuk dekorasi kamar anak) tetapi lingkaran 5,0cm, tambahkan atau kurangi 1mm, ( yaitu dalam 4,9 - 5,1 cm) akan diperlukan jika itu adalah proyek dekorasi untuk peluncuran proyek untuk beberapa perusahaan besar.
Misalnya, spesifikasi siklus muat / bongkar dari drive rumah mungkin ~ 300.000 kali, spesifikasi muat / bongkar drive perusahaan akan ~ 600.000 kali, dua kali lipat angka. Spesifikasi yang lebih ketat juga berlaku untuk rakitan drive dan proses pembuatan disk - dan dengan demikian tingkat kesalahan baca yang tidak dapat dipulihkan akan jauh lebih kecil untuk drive perusahaan, misalnya, drive rumah khas saat ini - Caviar Black (dari Western Digital) akan memiliki kesalahan baca yang tidak dapat dipulihkan per 10 ^ 14 bit baca. Bandingkan dengan hard drive biasa yang diproduksi ke server pusat data WD RE SAS, yang akan memiliki kesalahan baca yang tidak dapat dipulihkan per 10 ^ 15 bit. Apakah keandalan 10 kali lebih penting bagi Anda, adalah masalah lain.
Sejujurnya, bagaimana Anda menggunakan drive, kemungkinan lebih penting daripada drive yang Anda gunakan. Di bawah ini adalah ringkasan dari temuan google:
- 6-7% dari drive gagal dalam tahun pertama penggunaan. Di mana, lebih dari setengah dari drive yang gagal ini akan gagal dalam waktu 6 bulan. Drive ini cenderung sangat digunakan selama periode ini.
- Kegagalan drive mengikuti model puncak ganda. Puncak pertama adalah dalam 3 bulan, dan puncak kedua adalah sekitar 3 tahun.
- Setelah tahun pertama, secara umum ada tingkat kegagalan hard drive 8% per tahun.
- Efek suhu ada dua: [1] Tingkat kegagalan terendah terlihat pada disk yang berjalan sekitar 40 derajat C. [2] Saat drive bertambah, laju kegagalan naik secara ekspoensial dengan suhu pada tahun ketiga. Untuk menafsirkan pernyataan ini, menjalankan drive pada ~ 35C akan mencapai kompromi terbaik dari umur panjang dan kegagalan awal, dan jika hard drive Anda dapat diganti setiap 2 tahun, menjalankan drive sepanas 45C secara umum sebenarnya akan mengurangi tingkat kegagalan, tetapi melewati tahun kedua akan ada peningkatan eksponensial jika Anda menjalankannya di 45C.
- Jika Anda menggunakan perangkat lunak pelaporan SMART (yang bagus adalah Crystal Disk Info URL: http://crystalmark.info/software/CrystalDiskInfo/index-e.html ), jika Anda melihat satu kesalahan pemindaian, 10% akan gagal dalam beberapa hari, dan 30% dari drive akan gagal dalam 6 bulan. Dengan demikian, buat cadangan dan buang drive yang sesuai setelah Anda melihat yang pertama. Jika Anda melihat acara realokasi, 10% akan gagal dalam ~ 4 bulan. Perhatikan, namun hanya 60% dari semua kegagalan hard disk yang akan diprediksi oleh sistem SMART.
Memperbarui
MTBF
Berarti waktu antara kegagalan pada dasarnya tidak terlalu berguna bagi konsumen biasa. Waktu rata-rata antara kegagalan biasanya ideal dan teoritis . Katakanlah kita memiliki 500.000 drive dengan MTBF selama 500.000 jam - jika Anda menjalankan masing-masing dan setiapnya Anda akan melakukannyakemungkinan memiliki salah satu dari mereka gagal setiap jam, secara statistik, jika Anda menjalankannya dalam spesifikasi mereka (suhu, kelembaban, kualitas catu daya ...) Dengan mengacu pada studi google, kehidupan berguna yang realistis dari sebuah harddisk akan lebih seperti 2 tahun (dalam sistem non-redundan) atau 3 tahun (dalam sistem redundan) - jika Anda menggunakannya 24 jam sehari - Dalam sistem redundan (mis. RAID- [5,6]) Anda dapat kehilangan hard drive tanpa kehilangan data. Khususnya, di RAID 6 Anda dapat kehilangan hard drive dan masih memiliki redundansi selama proses pembangunan kembali.
Kehidupan pelayanan
Satu sering melihat beberapa produsen mengutip masa kerja seperti '5 tahun' dan kemudian menawarkan Anda garansi '3 tahun'. Terjemahan: "Kami percaya bahwa itu akan berlangsung sekitar 5 tahun. Jika gagal dalam tiga tahun pertama penggunaan, kami akan menggantinya dengan biaya kami, tetapi jika Anda gagal antara 3 dan 5 tahun, kasihan. Pasti tidak akan menjadi kasus bahwa kami telah menginstal semacam bom waktu untuk membuatnya tidak dapat digunakan pada ulang tahun kelima, tetapi Anda harus mendapatkan harddisk baru dan menggunakan hard drive 5 tahun ini jika data Anda berharga. "
Begitulah cara mereka mendefinisikannya seperti yang saya mengerti.
Terakhir tetapi tidak kalah pentingnya, cobalah membaca kertas google, ini adalah bacaan yang sangat baik.