Jawaban:
Deduplikasi adalah tempat Anda melihat konten kumpulan data, catat semua bit duplikat yang ada, dan simpan data hanya sekali, ganti semua salinan data dengan pointer kembali ke satu salinan. Ini sangat membantu dengan cadangan karena ketika Anda membuat cadangan hal-hal seperti server begitu banyak data yang sama. Bayangkan, misalnya, Anda mencadangkan 1.000 server Windows - banyak konten di kotak itu akan identik.
Deduplikasi sangat populer hari ini dengan 3 alasan:
Akhir-akhir ini semua orang terobsesi untuk membangun solusi pemulihan bencana yang menggunakan server di luar lokasi. Untuk melakukan ini, Anda harus mereplikasi banyak data produksi ke situs jarak jauh dan bandwidth adalah masalah besar. Setiap pengurangan jumlah data yang harus Anda tiru sangat membantu.
Jumlah data yang disimpan oleh perusahaan sedang meledak - berkat penyimpanan yang lebih murah dan persyaratan multi-industri untuk penyimpanan catatan.
Teknologi ini relatif baru-baru ini menyentuh sweet spot. Kami telah memiliki hal-hal seperti deduplikasi untuk waktu yang lama (penyimpanan satu contoh, dll) yang telah membantu tetapi hanya dalam setahun terakhir kami telah melihat deduplikasi nyata yang dapat secara signifikan mengurangi jumlah penyimpanan yang masuk ke arus utama.
Salah satu hal yang kami temukan di perusahaan saya dalam bekerja dengan Netapp adalah bahwa deduplikasi benar-benar hanya berfungsi dengan baik di lingkungan VM jika drive Anda disejajarkan. Yang merupakan masalah bagi kami karena kami memiliki banyak mesin Windows Server 2003 dan tidak ada drive yang selaras. Yang berarti Anda hampir tidak dapat memulihkan sekitar seperempat ruang yang mungkin jika drive disejajarkan dengan benar.
Kami diberi tahu bahwa setelah drive disejajarkan dengan benar, kami harus dapat memulihkan 40-60% ruang kami dengan dedup.