Database transaksional
RAID-5 relatif lambat untuk ditulis karena pengontrol perlu memuat data yang cukup untuk menghitung ulang paritas pada penulisan. Operasi tulis akan menimbulkan setidaknya empat operasi disk:
Jika sistem tidak menggunakan cache write-back, ini berarti bahwa semua operasi ini berada di jalur kritis untuk penyelesaian I / O. Seringkali, ini adalah kasus dengan penulisan database - pada kenyataannya, Microsoft (misalnya) memiliki program sertifikasi untuk peralatan SAN untuk digunakan dengan SQL server yang mengharuskan vendor untuk menjamin perilaku ini. Kadang-kadang peralatan RAID-5 yang lebih lama tidak menggunakan optimasi ini dan harus menghitung ulang paritas dari seluruh strip.
RAID-10 memiliki mirror untuk setiap drive tunggal dan tidak perlu membaca data tambahan untuk menghitung paritas. Ini berarti bahwa menulis membutuhkan I / O fisik yang jauh lebih sedikit.
RAID-50 berada di suatu tempat di tengah, dengan volume dibagi menjadi beberapa volume RAID-5, yang pada gilirannya bergaris-garis. Pada RAID-50 yang dibuat dari grup yang di-strip dalam skema 3 + 1, sebuah penulisan menghasilkan paling banyak tiga permintaan I / O disk tambahan. Jika Anda merasa sangat ingin, Anda dapat melihat RAID-5 dan RAID-10 sebagai kasus khusus RAID-50. RAID-50 terutama digunakan untuk menyediakan volume besar di banyak disk fisik
Skema paritas lain seperti RAID-6 (skema paritas dengan dua disk redundan per set) juga ada, disk modern cukup besar sehingga mem-rebulding sebuah array bisa memakan waktu yang cukup lama - cukup lama sehingga risiko kegagalan disk kedua selama membangun kembali cukup signifikan. RAID-6 mengurangi risiko ini dengan memiliki paritas disk kedua, yang membutuhkan tiga kegagalan disk untuk menyebabkan kehilangan data. Trik serupa dengan skema RAID-50 dapat digunakan untuk membuat array RAID-60.
Akhirnya, pasangan cermin tunggal (dikenal sebagai RAID-1) dapat memberikan redundansi dan kinerja yang cukup baik untuk beberapa tugas. Secara khusus Anda mungkin akan menemukan bahwa RAID-1 memberi Anda throughput yang cukup untuk cukup banyak lalu lintas log basis data. Lebih lanjut tentang ini di bawah ini.
Jika Anda memiliki beban kerja tulis-berat, Anda mungkin akan mendapatkan peningkatan kinerja dari volume RAID-10. Ini bisa menjadi kemenangan karena Anda mungkin bisa mendapatkan throughput yang diperlukan dari sejumlah kecil disk fisik, dengan asumsi disk memiliki cukup ruang). Beberapa item seperti log atau area temporay pada server database harus pada volume RAID-1 atau RAID-10, karena ini mendapatkan banyak lalu lintas tulis.
Log
Volume log ditandai oleh sebagian besar pola akses data berurutan, dan pada dasarnya merupakan buffer cincin yang terdiri dari perintah di sepanjang garis 'tulis data ini ke blok ini' Mereka ditulis sebagai produsen oleh mesin DBMS inti dan diproses sebagai conumer oleh fungsi pembaca log. Sepasang cermin tunggal sebenarnya akan menangani cukup banyak lalu lintas log.
Sistem baca berat dan server file
Pada sistem baca-berat seperti gudang data Anda mungkin ingin menggunakan satu atau lebih volume RAID-5. Pada server file, akses disk sebagian besar akan dilakukan pada seluruh file, jadi menulis mungkin akan menulis sebagian besar blok yang membentuk blok paritas. Dalam hal ini penalti kinerja untuk RAID-5 akan lebih ringan.
Di masa lalu penghematan biaya pada disk mungkin signifikan tetapi ini cenderung menjadi masalah sekarang.
Caching balasan dan RAID-5
Pada SAN atau pengontrol RAID internal dengan cache yang didukung baterai Anda mungkin dapat mengaktifkan caching 'Write-back'. Tembolok ini menulis dan mengembalikan kontrol ke aplikasi. I / O dilaporkan oleh controller sebagai selesai. Namun, itu tidak serta merta menuliskan data ke disk segera. Fasilitas ini memungkinkan operasi baca / tulis paritas RAID-5 secara substansial dioptimalkan dan dapat melunakkan penalti kinerja tulis untuk volume RAID-5x.
Namun, ini masih membawa risiko kecil masalah integritas data. Sistem host telah diberitahu bahwa penulisan ini telah selesai ketika ini tidak benar-benar terjadi. Dimungkinkan untuk kegagalan perangkat keras membuat inkonsistensi data antara (katakanlah) log dan volume data pada server database. Karena alasan ini, cache balasan tidak disarankan untuk sistem transaksional, meskipun mungkin ini merupakan kemenangan kinerja untuk sesuatu seperti proses ETL.
Ringkasan
Ruang disk saat ini sangat murah sehingga sistem transaksional mungkin harus menggunakan RAID-1 atau RAID-10 untuk volume log dan RAID-10 untuk volume data. Ukuran disk fisik cenderung jauh lebih besar dari database dan RAID-10 akan memungkinkan throughput penulisan lebih banyak untuk jumlah disk yang sama, berpotensi mengurangi jumlah volume disk yang diperlukan untuk mendukung sistem.
Pada sesuatu seperti gudang data Anda masih dapat mengunyah ruang dengan tabel fakta yang besar dan sangat terindeks sehingga Anda mungkin mendapatkan kemenangan harga yang kecil dengan volume data RAID-5 atau RAID-50. Namun log dan tempdb masih harus ditempatkan pada volume RAID-10 karena mereka mungkin akan mendapatkan banyak pekerjaan selama pemrosesan ETL. Namun, penghematan biaya pada disk cenderung cukup kecil.