Orang lain menyarankan untuk mengirim pesan biasa yang mengatakan bahwa semuanya baik-baik saja, tetapi secara pribadi saya tidak setuju dengan itu. Pemantauan harus diam kecuali ada masalah, dan jangan pernah mengandalkan pengguna yang menyadari ada sesuatu yang salah, seperti "Oh, saya belum mendapatkan email harian itu dalam beberapa hari." Terutama jika Anda memiliki lebih dari satu orang menanggapi peringatan, masing-masing mungkin berpikir bahwa orang lain telah menghapus pesan "Aku baik-baik saja" harian.
Kami memiliki layanan eksternal (yang jumlahnya ratusan, tetapi kami menggunakan wormly ) untuk melakukan pemeriksaan HTTP dari server pemantauan kami untuk memastikan bahwa itu sudah habis dan dapat mencapai Internet. Itulah perhatian utama kami untuk memantaunya. Kemudian server Nagios kami memantau semua server Nagios klien kami.
Tapi, Anda memunculkan poin yang bagus. Kami mungkin harus menambahkan URL HTTP yang memeriksa antrian postfix dan jika itu menunjukkan jumlah pesan yang tidak biasa, yang mungkin berarti ada antrian di dalamnya , kemudian naikkan lansiran. Opsi lain adalah menggunakan metode yang berbeda untuk peringatan, misalkan agen pengiriman SMS non-SMTP serta SMTP yang saat ini kami gunakan.
Namun dalam kasus kami, saya tidak dapat mengingat bahwa server email kami pernah mati. Tentu saja, semua yang digunakan server mail adalah mengirimkan peringatan Nagios, sehingga konfigurasinya sangat sederhana dan hampir tidak pernah berubah.