Bagaimana jika tornado melewati pusat data ANDA?


8

Selama akhir pekan terakhir ini kami mengalami badai hebat di sini di Virginia dan tentu saja krisis di Jepang adalah pengingat bahwa hal-hal dapat memburuk dalam sekejap! Saya bertanya pada diri sendiri, "Bagaimana jika tornado menghantam pusat data saya, apakah saya siap?"

Saya memiliki sistem cadangan yang bagus "di rak saya" termasuk cadangan kaset. Karena pusat data tidak menutup, memindahkan kaset dari situs tidak dimungkinkan. Yang ingin saya temukan atau ciptakan adalah sistem yang sesuai jadwal yang dapat mencadangkan item penting seperti situs web, basis data, dan menyalinnya dari jarak jauh, yaitu server saya di rumah. Saya memiliki FIOS dengan layanan 35 mbit sehingga saya memiliki broadband, yang saya butuhkan adalah "sistem" untuk melakukan ini. Saya seorang programmer sehingga saya dapat membuat sesuatu yang informasi down FTP pada jadwal, tapi saya ingin tahu apakah ada sesuatu di luar sana yang akan memenuhi kebutuhan cadangan jarak jauh ini sekarang? Server SQL saya dicadangkan ke array penyimpanan, saya dapat menurunkan cadangan atau bahkan menjadwalkan server SQL saya di sini untuk menyinkronkan dengan server produksi sesuai jadwal. Saya menggunakan Windows Server 2008 R2 dan SQL Server 2008 R2.

Apa yang Anda semua rekomendasikan untuk strategi di luar lokasi dalam krisis seperti bencana alam yang menghancurkan pusat data kami? Apakah kamu siap Saya harap orang lain bertanya pada diri sendiri pertanyaan ini dan belajar dari bencana alam yang sudah sering kita lihat.

Jawaban:


6

Pilihan Anda harus ditentukan oleh perjanjian tingkat layanan Anda dengan pelanggan Anda dan dibatasi oleh anggaran Anda.

Paling tidak, Anda harus memiliki cadangan semua data penting di luar situs. Hari ini, data apa pun yang tidak dapat Anda buat ulang dari awal harus disimpan di tempat lain. Pencadangan offline lebih baik: pencadangan atau replikasi online mungkin membantu ketika tornado menghantam, tetapi apa yang terjadi jika Anda memiliki karyawan yang marah menjatuhkan database atau menghancurkan sistem file?

Dari baseline cadangan offline, Anda dapat mulai mengeksplorasi opsi yang akan mempercepat pemulihan dengan imbalan biaya yang lebih tinggi. Ada sejumlah besar opsi di sini mulai dari satu host untuk cadangan online yang Anda gambarkan sampai ke lingkungan yang sepenuhnya direplikasi dengan replikasi data sinkron yang aktif (-aktif) + untuk downtime mendekati nol.

Anda akan menemukan pemulihan-dari-awal menjadi lebih mudah jika Anda memisahkan data Anda dari infrastruktur Anda serapi mungkin. Misalnya, pemulihan dari awal akan jauh lebih cepat jika Anda menggunakan sistem seperti boneka atau koki daripada dengan tangan. Mengulangi semua pekerjaan yang Anda lakukan untuk membangun sistem Anda akan jauh lebih cepat jika Anda dapat mengotomatisasi sebanyak mungkin. Memisahkan data juga mengurangi jumlah data yang harus Anda buat cadangan: jangan spin off gigabytes OS jika Anda hanya benar-benar membutuhkan beberapa MB konfigurasi sistem dan data aplikasi.

Opsi bisa menjadi sangat mahal, jadi Anda perlu menentukan apa yang perusahaan Anda akan habiskan untuk pemulihan bencana dan berapa banyak downtime yang dapat ditoleransi pelanggan Anda. Hilangkan opsi yang terlalu mahal atau terlalu lambat untuk pelanggan Anda.

Setelah Anda memilih solusi pemulihan bencana, pastikan Anda mempraktikkannya. Saya akan merekomendasikan setidaknya setahun sekali atau setiap kali arsitektur Anda berubah, mana yang lebih sering terjadi.


2

Business Continuity berjalan jauh, lebih jauh dari sekadar memastikan Anda memiliki akses ke cadangan yang dapat dibaca. Tetapi membatasi ruang lingkup jawaban hanya untuk itu, pada akhirnya itu hanya akan menjadi layak di mana bandwidth end-to-end dari pusat data ke lokasi cadangan cukup besar untuk menangani volume perubahan data.

Ketika Anda berbicara tentang pusat data, maka bagi kebanyakan orang itu adalah data Gigaytes per minggu.

IME, bahkan dalam skala kecil solusi terbaik adalah operasi terdistribusi (atau cermin). Rencanakan dengan benar dan harus ada sedikit biaya overhead dibandingkan dengan pusat data tunggal.

Tetapi jika Anda harus menyalin semua data ke lokasi siaga atau bahkan hanya ke penyimpanan jarak jauh, maka

1) jangan gunakan FTP - itu hanya cara yang salah untuk melakukannya karena banyak alasan

2) untuk file generik, gunakan sesuatu seperti rsync yang dioptimalkan untuk tujuan tersebut

3) untuk database, lihat alat yang tersedia khusus untuk DBMS Anda - struktur file dapat berubah secara besar-besaran tanpa banyak data berubah. NB ini memasukkan registri MSWindows dan data MSAD.


1

Kami memiliki VPN dari kantor kami ke pusat data luar kantor kami. Di pusat data luar kantor kami memiliki server yang memiliki jaringan yang dipasang yang kami konfigurasikan sebagai tujuan dalam perangkat lunak cadangan kami (kami menjalankan Symantec BackupExec) yaitu \ OFFSITEDATACENTER \ OFFSITESTORAGE

Kami kemudian melakukan - pencadangan penuh selama akhir pekan ke lokasi itu
- tambahan setiap malam

Serta cadangan "onsite" normal kami

Kami juga menjalankan VMWare VDR untuk mengambil gambar dari server utama kami setiap minggu yang dimasukkan ke disk SATA 2TB yang dienkripsi menggunakan FreeOTFE yang saya bawa pulang setiap minggu.


1

Kami memiliki sejumlah pusat data aktif / aktif atau aktif / semi-aktif yang terpisah dengan jarak> 50 mil di antaranya, pemasok daya yang berbeda, keamanan, tautan terhubung 10GBps yang dialihkan secara beragam di antara mereka, oh, dan kami juga mengirimkan disk cadangan kami di antara keduanya. Ini berlaku untuk kita.


0

Spesifik menangani skema cadangan tertentu telah dibahas di sini dan di tempat lain. Saya akan mendekati pertanyaan ini dari sudut pandang umum pedoman tingkat tinggi untuk membantu Anda memutuskan bagaimana mendekati pemulihan bencana. Saya telah berada dalam beberapa situasi di mana perencanaan harus ada jika pusat data menjadi kawah merokok. Untungnya, kami hanya perlu menggunakannya sekali. Hal yang paling penting untuk diingat adalah:

1) Jangan buang waktu Anda untuk mencoba overengineer dan membuat semuanya gagal dengan ketelitian <1ms jika Anda tidak perlu. Kegagalan total sebesar itu biasanya akan memaafkan pemulihan selama beberapa jam.

2) Sebagai konsekuensi wajar untuk # 1, pastikan bahwa harapan ditentukan secara realistis dan dikodekan dalam suatu kebijakan di suatu tempat. Memiliki tujuan yang ditetapkan untuk mencapai sejauh waktu pemulihan adalah penting, karena Anda dapat menghabiskan waktu tanpa batas dan menghasilkan dana adalah "lebih baik."

3) Prioritaskan sistem Anda. Rencana pemulihan perlu dibangun di sekitar daftar definitif tentang pentingnya masing-masing dan setiap sistem. Jangan lewatkan hal-hal yang sudah jelas, baik, seperti mendapatkan DNS dan AD sebelum server Windows lainnya.

4) Jika bukan di luar dan di luar jaringan, itu hanya salinan. Ini sejalan dengan hal utama yang perlu diingat: RAID bukan rencana cadangan.

5) Uji, Uji, UJI! Uji setiap inci dari rencana Anda yang Anda bisa. Jika Anda bisa mendapatkan nilai akhir pekan untuk masa pemeliharaan, putuskan hubungan uplink dan / atau kekuatan bangunan dan uji waktu reaksi dan efektivitas tim Anda. Rencana pemulihan bencana yang tidak pernah diuji hanyalah angan-angan.

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.