Beberapa kebenaran di rumah tentang penyimpanan, atau mengapa penyimpanan perusahaan sangat mahal?
Hard drive konsumen menawarkan volume ruang yang besar sehingga bahkan pengguna yang paling cerdas dari * batuk * media streaming * batuk * dapat membeli cukup untuk menyimpan koleksi beberapa terabyte. Faktanya, kapasitas disk telah tumbuh lebih cepat daripada jumlah transistor pada silikon selama beberapa dekade sekarang.
Penyimpanan 'Enterprise' adalah masalah yang agak lebih kompleks karena data memiliki persyaratan kinerja dan integritas yang menentukan pendekatan yang agak lebih berat. Data harus memiliki jaminan ketersediaan jika terjadi kegagalan perangkat keras dan mungkin harus dibagikan dengan sejumlah besar pengguna, yang akan menghasilkan lebih banyak permintaan baca / tulis daripada satu pengguna.
Solusi teknis untuk masalah ini bisa menjadi banyak, berkali-kali lebih mahal per gigabyte daripada solusi penyimpanan konsumen. Mereka juga membutuhkan perawatan fisik; cadangan harus diambil dan sering disimpan di luar lokasi sehingga api tidak merusak data. Proses ini menambah biaya berkelanjutan.
Performa
Pada konsumen 1TB Anda atau bahkan drive jarak dekat perusahaan, Anda hanya memiliki satu kepala. Disk berputar pada 7200 RPM, atau 120 putaran per detik. Ini berarti bahwa Anda bisa mendapatkan paling banyak 120 operasi I / O akses acak per detik dalam teori * dan agak kurang dalam praktiknya. Dengan demikian, menyalin file besar pada volume 1TB tunggal relatif lambat.
Pada disk array dengan disk 14x 72GB, Anda memiliki disk 14 head lebih dari (katakanlah) 15.000 RPM atau sekitar 250 putaran per detik. Ini memberi Anda maksimum teoritis 3.500 operasi I / O acak per detik * (sekali lagi, dalam praktiknya sedikit kurang). Semua hal lain yang dianggap sama dengan salinan file akan banyak, banyak kali lebih cepat.
*
Anda bisa mendapatkan lebih dari satu akses acak per revolusi disk jika geometri bacaan memungkinkan drive untuk memindahkan kepala dan membaca sektor yang kebetulan tersedia dalam satu putaran disk. Jika akses disk tersebar secara luas, Anda mungkin akan rata-rata kurang dari satu. Di mana array disk diformat dalam tata letak bergaris (lihat di bawah), Anda akan mendapatkan maksimum satu strip membaca per revolusi disk dalam sebagian besar keadaan dan (tergantung pada pengontrol RAID) mungkin kurang dari satu rata-rata.
Drive 7200 RPM 1TB mungkin akan cukup cepat untuk I / O berurutan. Disk array diformat dalam skema bergaris (RAID-0, RAID-5, RAID-10 dll) biasanya dapat membaca paling banyak satu strip per revolusi disk. Dengan strip 64K kita dapat membaca 64Kx250 = 16MB atau lebih data per detik dari disk 15.000 RPM. Ini memberikan throughput sekuensial sekitar 220MB per detik pada larik 14 disk, yang tidak lebih cepat di atas kertas daripada 150MB / detik atau lebih untuk disk SATA 1TB modern.
Untuk streaming video (misalnya), array 4 disk SATA dalam RAID-0 dengan ukuran garis besar (beberapa pengontrol RAID akan mendukung ukuran garis hingga 1MB) memiliki banyak throughput sekuensial. Contoh ini secara teoritis dapat melakukan streaming sekitar 480MB / detik, yang cukup nyaman untuk melakukan pengeditan video HD tanpa kompresi waktu-nyata. Dengan demikian, pemilik Mac Pro dan perangkat keras serupa dapat melakukan tugas-tugas pengomposisian video HD yang membutuhkan mesin dengan susunan serat-sambung langsung beberapa tahun yang lalu.
Manfaat sebenarnya dari array disk adalah pada pekerjaan basis data yang ditandai dengan sejumlah besar kecil, permintaan I / O yang tersebar. Pada jenis ini, kinerja beban kerja dibatasi oleh latensi fisik bit logam dalam cakram berputar-putar dan maju-mundur. Metrik ini dikenal sebagai IOPS (operasi I / O per detik). Semakin banyak disk fisik yang Anda miliki - terlepas dari kapasitasnya - semakin banyak IOPS yang dapat Anda lakukan secara teoritis. Lebih banyak IOPS berarti lebih banyak transaksi per detik.
Integritas data
Selain itu, sebagian besar konfigurasi RAID memberi Anda redundansi data - yang memerlukan lebih dari satu disk fisik menurut definisi. Kombinasi skema penyimpanan dengan redundansi seperti itu dan jumlah drive yang lebih besar memberi sistem kemampuan untuk secara andal melayani beban kerja transaksional yang besar.
Infrastruktur untuk array disk (dan SAN dalam kasus yang lebih ekstrem) bukanlah item pasar massal. Selain itu itu adalah salah satu bit yang benar-benar tidak dapat gagal. Kombinasi standar bangunan dan volume pasar yang lebih kecil ini tidak murah.
Total biaya penyimpanan termasuk cadangan
Dalam praktiknya, biaya terbesar untuk mempertahankan 1TB data kemungkinan adalah pencadangan dan pemulihan. Drive tape dan 34 set SDLT atau kaset ultrium untuk siklus backup dan pemulihan kakek lengkap mungkin akan lebih mahal daripada array disk 1TB. Tambahkan biaya penyimpanan di luar situs dan gaji bahkan satu tape-monyet dan tiba-tiba 1TB data Anda tidak terlalu murah.
Biaya disk seringkali merupakan cara yang adil dalam hierarki biaya penyimpanan yang dominan. Di satu bank saya punya kesempatan untuk bekerja untuk penyimpanan SAN biayanya £ 900 / GB untuk sistem pengembangan dan £ 5.000 / GB untuk disk pada server produksi. Bahkan dengan harga vendor perusahaan, biaya fisik disk hanya sebagian kecil dari itu. Contoh lain yang saya tahu memiliki (relatif) dikonfigurasi IBM Shark SAN yang harganya di suatu tempat lebih dari £ 1 juta. Hanya penyimpanan fisik untuk ini yang dikenakan biaya sekitar £ 9 / gigabyte, atau sekitar £ 9.000 untuk ruang yang setara dengan HDD konsumen 1TB Anda.