Tampaknya konsensus umum adalah bahwa jawaban untuk pertanyaan Anda datang dalam dua bagian:
Bagaimana kita menemukan sumber bau terbakar yang lucu?
Anda telah mendapatkan "How" dengan cukup baik:
- "Tes Mengendus"
- Cari asap / kabut yang terlihat
- Jelajahi ruangan dengan kamera termal (IR) untuk menemukan hot spot
- Periksa panel pemantauan dan perangkat untuk peringatan
Anda dapat meningkatkan peluang Anda menemukan masalah dengan cepat dalam beberapa cara - pemantauan yang lebih baik seringkali paling mudah. Beberapa pertanyaan untuk diajukan:
- Apakah Anda mendapatkan peringatan suhu dan kesehatan lainnya dari peralatan Anda?
- Apakah sistem UPS Anda melaporkan kesalahan pada sistem pemantauan Anda?
- Apakah Anda mendapatkan alarm penarikan arus dari peralatan distribusi daya Anda?
- Apakah detektor asap ruangan melapor ke sistem pemantauan? (dan bisakah mereka? )
Kapan sebaiknya kita memecahkan masalah versus menekan Sakelar Merah Besar?
Ini pertanyaan yang lebih menarik.
Menekan tombol merah besar dapat membuat perusahaan Anda sangat tergesa-gesa dalam waktu singkat: Pembebasan agen bersih dapat mencapai puluhan ribu dolar, dan biaya pemadaman / pemulihan setelah pematian darurat (EPO, "menjatuhkan kamar" ) dapat menghancurkan.
Anda tidak ingin menjatuhkan pusat data karena kapasitor dalam catu daya muncul dan membuat ruangan berbau.
Sebaliknya, kebakaran di ruang server dapat membebani data / peralatan perusahaan Anda, dan yang lebih penting adalah nyawa staf Anda.
Pemecahan masalah "bau pembakaran yang lucu" tidak boleh diutamakan daripada keamanan , jadi penting untuk memiliki beberapa aturan yang jelas tentang mengatasi masalah kondisi "pra-kebakaran".
Pedoman yang mengikuti adalah keterbatasan pribadi saya yang saya terapkan dengan tidak adanya (atau sebagai tambahan) prosedur / aturan lain yang jelas - mereka telah melayani saya dengan baik dan mereka dapat membantu Anda, tetapi mereka dapat dengan mudah membuat saya terbunuh atau dipecat besok, jadi terapkan itu dengan risiko Anda sendiri.
Jika Anda melihat asap atau api, jatuhkan ruangan.
Ini harus pergi tanpa berkata tetapi katakan saja: Jika ada kebakaran aktif (atau asap menunjukkan bahwa akan segera ada), Anda mengevakuasi ruangan, memotong daya, dan melepaskan api. sistem penindasan.
Pengecualian mungkin ada (gunakan akal sehat), tetapi ini hampir selalu merupakan tindakan yang benar.
Jika Anda melanjutkan untuk memecahkan masalah, selalu melibatkan setidaknya satu orang lain.
Ini karena dua alasan. Pertama, Anda tidak ingin berkeliaran di pusat data dan tiba-tiba ada rak naik di baris Anda berjalan dan tidak ada yang tahu Anda ada di sana. Kedua, orang lain adalah pemeriksaan kewarasan Anda tentang pemecahan masalah versus menjatuhkan ruangan, dan jika Anda membuat panggilan untuk menekan Big Red Switch Anda memiliki manfaat memiliki orang kedua yang setuju dengan keputusan (membantu untuk menghindari aspek yang membatasi karir keputusan seperti itu jika seseorang mempertanyakannya nanti).
Melaksanakan langkah-langkah keamanan yang bijaksana saat pemecahan masalah
Pastikan Anda selalu memiliki jalur keluar (ujung terbuka dari baris dan jalur yang jelas untuk keluar).
Biarkan seseorang tetap berada di rilis EPO / pencegah kebakaran.
Bawa pemadam api bersama Anda (Halon atau agen kebersihan lainnya, silakan).
Ingat aturan # 1 di atas.
Jika ragu, tinggalkan ruangan . Jaga pernapasan Anda: gunakan respirator atau masker oksigen. Ini mungkin menyelamatkan kesehatan Anda jika terjadi kebakaran kimia.
Tetapkan batas dan patuhi
lebih tepatnya, tetapkan dua batas:
- Kondisi ("Seberapa parah saya akan membiarkan ini?"), Dan
- Waktu ("Berapa lama saya akan terus berusaha menemukan masalah sebelum terlalu berisiko?").
Batas yang Anda tetapkan juga dapat digunakan untuk membiarkan tim Anda memulai pematian tertib area yang terkena, jadi ketika Anda DO menarik daya, Anda tidak menabrak banyak mesin yang aktif, dan waktu pemulihan Anda akan jauh lebih pendek, tetapi ingat bahwa jika pematian tertib terlalu lama, Anda mungkin harus membiarkan beberapa sistem mengalami gangguan atas nama keselamatan.
Percayai nyali
Anda. Jika Anda khawatir tentang keselamatan kapan saja, matikan pemecahan masalah dan hapus ruang.
Anda mungkin atau mungkin tidak menjatuhkan ruangan berdasarkan firasat, tetapi pengelompokan ulang di luar ruangan dalam (relatif) keselamatan adalah bijaksana.
Jika tidak ada bahaya yang akan terjadi, Anda dapat memilih membawa pemadam kebakaran setempat sebelum mengambil tindakan drastis seperti pelepasan EPO atau agen kebersihan. (Mereka mungkin menyuruh Anda melakukannya: Mandat mereka adalah untuk melindungi orang, lalu properti, tetapi mereka jelas ahli dalam menangani kebakaran sehingga Anda harus melakukan apa yang mereka katakan!)
Kami telah membahas hal ini dalam komentar, tetapi mungkin juga dirangkum dalam jawaban juga - @DeerHunter, @Chris, @Sirex, dan banyak lainnya berkontribusi pada diskusi