Beberapa literatur tentang kompresi data SQL Server yang saya baca menyatakan bahwa biaya penulisan meningkat menjadi sekitar empat kali lipat dari yang biasanya diperlukan. Tampaknya juga menyiratkan bahwa ini adalah kelemahan utama untuk kompresi data, sangat menyiratkan bahwa untuk database arsip read-only, kinerja akan (dengan beberapa pengecualian) ditingkatkan dengan penggunaan kompresi data dari 100% halaman yang diisi.
- Apakah pernyataan di atas benar?
Apa "variasi" utama antara kompresi data dan cara lainnya (untuk membaca)
- "CPU + x%"?
- "IO -y%"?
- terjadinya pemisah halaman?
- penggunaan tempdb?
- Penggunaan RAM?
- Dan untuk menulis?
Untuk keperluan pertanyaan ini, Anda dapat membatasi konteks ke kompresi tingkat PAGE dari database besar (> 1TB) , tetapi komentar tambahan selalu diterima.
Referensi:
SQL Server Storage Engine Blog (Skenario DW menunjukkan kompresi menjadi sangat menguntungkan)
Kompresi Data: Strategi, Perencanaan Kapasitas dan Praktik Terbaik
Pendekatan yang lebih rinci untuk memutuskan apa yang akan dikompres melibatkan analisis karakteristik beban kerja untuk setiap tabel dan indeks. Ini didasarkan pada dua metrik berikut:
U: Persentase operasi pembaruan pada tabel, indeks, atau partisi tertentu, relatif terhadap total operasi pada objek itu. Semakin rendah nilai U (yaitu, tabel, indeks, atau partisi jarang diperbarui), kandidat yang lebih baik untuk kompresi halaman.
S: Persentase operasi pemindaian pada tabel, indeks, atau partisi, relatif terhadap total operasi pada objek itu. Semakin tinggi nilai S (yaitu, tabel, indeks, atau partisi sebagian besar dipindai), semakin baik kandidat untuk kompresi halaman.
Kedua hal di atas jelas-jelas bias terhadap rekomendasi kompresi halaman untuk database gaya DW (baca-intensif / eksklusif, operasi big-data).