Saya sedang mempertimbangkan untuk menggunakan pengaturan RAID0 untuk salah satu kluster SQL Server kami. Saya akan menguraikan situasi dan mencari mengapa ini mungkin ide yang buruk. Juga jika seseorang yang pernah menggunakan kasing, kertas putih, atau dokumentasi lain yang bisa Anda tunjukkan pada topik ini, itu akan bagus.
Kami memiliki 3 server di 2 pusat data yang merupakan bagian dari kluster SQL. Mereka semua menjalankan SQL Server di Grup Ketersediaan. Primer memiliki replika duduk tepat di sebelahnya dan yang lain di pusat data lainnya. Mereka menjalankan replikasi sinkron dengan failover otomatis. Semua drive adalah SSD kelas perusahaan. Mereka akan menjalankan SQL Server 2017 atau 2019.
Saya berpikir bahwa akan ada banyak manfaat untuk menjalankannya pada array RAID0 atas metode lain dengan sedikit, jika ada, kelemahan nyata. Satu-satunya negatif yang saya lihat saat ini adalah kurangnya redundansi pada server utama, sehingga gagal meningkat. Sebagai pro:
Jika drive gagal, alih-alih berjalan dalam keadaan melambat, terdegradasi hingga seseorang menerima pemberitahuan dan bertindak secara manual di atasnya, server akan segera gagal ke sekunder yang mempertahankan kemampuan operasional penuh. Ini akan memiliki manfaat tambahan dengan memberi tahu kami tentang kegagalan, sehingga kami dapat menyelidiki penyebabnya lebih cepat.
Ini mengurangi kemungkinan kegagalan keseluruhan per kapasitas TB. Karena kita tidak memerlukan paritas atau mirror drive, kami mengurangi jumlah drive per array. Dengan drive yang lebih sedikit, kemungkinan kegagalan drive lebih sedikit.
Itu lebih murah. Membutuhkan lebih sedikit drive untuk kapasitas yang diperlukan jelas lebih murah.
Saya tahu ini bukan pemikiran bisnis konvensional, tetapi apakah ada sesuatu yang tidak saya pertimbangkan? Saya suka masukan apa pun baik pro atau kontra.
Saya tidak mencoba melakukan ini untuk mendapatkan kinerja permintaan, meskipun jika ada yang bermakna jangan ragu untuk menunjukkannya. Kekhawatiran utama saya adalah gagal untuk mempertimbangkan atau mengatasi masalah keandalan atau redundansi yang belum saya pikirkan.
OS berada di drive cermin terpisah, sehingga server itu sendiri harus tetap terjaga. Salah satu drive tersebut dapat diganti dan dicerminkan lagi. Ini kecil dan tidak ada file database selain sistem DB di dalamnya. Saya tidak bisa membayangkannya butuh lebih dari beberapa menit. Jika salah satu array data gagal, kami mengganti drive, membangun kembali array, mengembalikan dan menyinkronkan kembali dengan AG. Dalam pengalaman pribadi saya, memulihkan jauh lebih cepat daripada membangun kembali drive RAID5. Saya belum pernah mengalami kegagalan RAID1, jadi saya tidak tahu apakah pembangunan kembali itu akan lebih cepat atau tidak. Pemulihan akan datang dari cadangan dan bergulir ke depan untuk mencocokkan primer, sehingga peningkatan beban pada server primer harus sangat minimal hanya menyinkronkan beberapa menit terakhir log dengan replika yang dipulihkan.