Sobrique menjelaskan bagaimana intervensi manual menyebabkan solusi yang Anda usulkan menjadi optimal , dan banyak orang yang berbicara tentang kemungkinan kegagalan berbagai komponen . Kedua IMO itu membuat poin yang sangat bagus dan harus dipertimbangkan dengan kuat.
Namun ada satu masalah yang tampaknya tidak ada yang mengomentari sejauh ini, yang sedikit mengejutkan saya. Anda melamar:
menjadikan [host cadangan panas saat ini] cadangan dingin, ambil hard drive, dan masukkan ke host utama dan ubah RAID dari 1 menjadi 1 + 1.
Ini tidak melindungi Anda dari apa pun yang dilakukan OS pada disk.
Ini hanya benar-benar melindungi Anda terhadap kerusakan disk, yang dengan berpindah dari mirror (RAID 1) ke mirror of mirror (RAID 1 +1) Anda sangat mengurangi dampak untuk memulainya. Anda bisa mendapatkan hasil yang sama dengan menambah jumlah disk di setiap set mirror (mulai dari 2-disk RAID 1 ke 4-disk RAID 1, misalnya), bersama dengan kemungkinan besar meningkatkan kinerja membaca selama operasi biasa.
Kalau begitu, mari kita lihat beberapa cara ini bisa gagal .
- Katakanlah Anda menginstal pembaruan sistem, dan sesuatu menyebabkan proses gagal setengah jalan; mungkin ada kegagalan daya dan UPS , atau mungkin Anda mengalami kecelakaan aneh dan menabrak bug kernel yang melumpuhkan (Linux cukup andal akhir-akhir ini, tetapi masih ada resikonya).
- Mungkin pembaruan memperkenalkan masalah yang tidak Anda tangkap selama pengujian (Anda melakukan pembaruan sistem pengujian, kan?) Yang memerlukan failover ke sistem sekunder saat Anda memperbaiki yang utama
- Mungkin bug dalam kode sistem file menyebabkan penulisan palsu ke disk.
- Mungkin administrator dengan jari yang gendut (atau bahkan jahat) melakukannya
rm -rf ../*
atau rm -rf /*
sebaliknya rm -rf ./*
.
- Mungkin bug dalam perangkat lunak Anda sendiri menyebabkannya merusak konten database secara besar-besaran.
- Mungkin virus berhasil menyelinap masuk.
Mungkin, mungkin, mungkin ... (dan saya yakin ada banyak lagi cara pendekatan yang diusulkan Anda bisa gagal.) Namun, pada akhirnya ini bermuara pada "dua set Anda selalu sinkron" "keuntungan". Terkadang Anda tidak ingin mereka benar-benar sinkron.
Tergantung pada apa yang sebenarnya telah terjadi, saat itulah Anda ingin siaga panas atau dingin siap untuk dinyalakan dan dinyalakan, atau cadangan yang tepat. Either way, RAID mirror of mirror (atau RAID mirror) tidak membantu Anda jika mode kegagalan melibatkan banyak hal selain dari kegagalan perangkat penyimpanan perangkat keras (disk crash). Sesuatu seperti raidzN ZFS mungkin bisa melakukan sedikit lebih baik dalam beberapa hal tetapi sama sekali tidak lebih baik dalam hal lain.
Bagi saya, ini akan membuat pendekatan yang Anda usulkan tidak boleh dilakukan sejak awal jika tujuannya adalah segala jenis bencana yang gagal.