Memantau strategi untuk infrastruktur


12

Akhir-akhir ini, saya menghadapi beberapa downtime di beberapa situs Drupal yang saya gunakan. Saya ingin mendekati masalah secara pro-aktif, daripada bereaksi terhadap downtime dengan memulai kembali layanan atau server itu sendiri. Saya telah membaca tentang alat pemantauan seperti nagios, munin, cacti, dll untuk memantau kesehatan server / infrastruktur Anda, tetapi saya belum benar-benar mencobanya dalam produksi. Saya berurusan dengan Drupal hampir 99%, dan saya ingin mengetahui saran untuk pemantauan tingkat server, dan pemantauan tingkat Drupal (kode aplikasi).

Pada dasarnya, saya ingin diberi tahu ketika server memuat tinggi, mungkin diarahkan ke pelakunya (atau korban), sehingga saya bisa mengambil keputusan. Saya juga ingin tahu apa yang digunakan orang untuk pemantauan tingkat Drupal (seperti mengirim email) ketika ada kesalahan / peringatan PHP. (Apa yang terjadi ketika server email itu sendiri turun?)

Jawaban:


6

Jika Anda ingin memantau beberapa situs Drupal dari tempat yang sama dengan peringatan, dll ... Saya dapat mengatakan Anda bukan satu-satunya. Ini mulai menjadi ceruk bisnis, sekarang diisi oleh:

Keduanya adalah pendekatan SaaS komersial, dengan opsi terbatas gratis untuk mencoba layanan.

Juga ada opsi pemantauan Open Source Zabbix dengan modul Drupal http://drupal.org/project/zabbix , tetapi kemudian Anda harus mengkonfigurasi dan membangun sendiri server.

Semua opsi ini memiliki modul Drupal untuk mengirim server dan informasi spesifik drupal ke server monitor.

MEMPERBARUI. Munin juga memiliki Modul Drupal spesifik , dengan cabang 2.x berdasarkan Drush.


Saya mencoba peninggalan baru dengan drupal dan saya harus mengatakan itu sangat luas dalam cara yang baik sebagian besar waktu (xhprof lebih atau kurang adalah pengganti yang baik untuk jejak transaksi di NR tetapi pengumpulan data tidak dapat dipertahankan). Juga telah mendengar tentang drupal.org mengadopsi nagios untuk pemantauan, Terima kasih atas jawaban Anda, saya akan menunggu beberapa hari lagi untuk pasangan sebelum memilihnya.
Dipen

5

Apa pun yang Anda gunakan, satu hal yang pasti akan saya sarankan adalah — kecuali Anda memiliki staf TI penuh waktu — jangan mempertahankan pemantauan Anda sendiri: mengandalkan layanan yang sepenuhnya independen dari server Anda. Ini adalah satu hal untuk memiliki server menghadap publik turun, itu lain untuk memilikinya turun dan tidak mengetahuinya karena server pemantauan Anda juga turun. Sebagian besar layanan pemantauan akan mencakup semua persyaratan yang Anda cantumkan di luar kotak.

Tetapi dengan risiko ini berubah menjadi pertanyaan rekomendasi belanja, layanan yang saya gunakan untuk persyaratan yang Anda daftarkan adalah Pingdom :

  • Memberitahu Anda jika sebuah situs naik (tentu saja)
  • Mengukur berapa lama untuk merespons
  • Mengukur responsif dan ketersediaan pada port TCP / UDP khusus
  • Pemeriksaan ketersediaan email
  • Mengizinkan permintaan HTTP khusus, memungkinkan Anda menguji berbagai aspek aplikasi Anda
  • Pelaporan yang luas
  • Pemantauan di seluruh dunia, dan mereka menambahkan sekitar selusin situs pemantauan setiap beberapa bulan

Saya sudah menggunakan site24x7.com dan juga pingdom (untuk situs berbeda) untuk memberi peringatan, saya ingin pemantauan yang secara proaktif memberi tahu saya tentang penggunaan sumber daya atau masalah potensial dan terintegrasi erat dengan lingkungan server. Terima kasih atas jawaban anda.
Dipen

2

Ini adalah beberapa saran Drupal-agnostik:

  • Are My Sites Up akan secara berkala melakukan ping ke server Anda dan akan mengirim email kepada Anda (atau SMS jika Anda mendapatkan paket tidak bebas) jika situs Anda sedang offline atau tidak responsif.
  • Load Impact adalah alat gratis hebat lainnya yang dapat menguji stres situs web Anda sehingga Anda dapat mengetahui kapan tepatnya mulai gagal.

Sejauh aplikasi Drupal itu sendiri, saya akan menyarankan menggunakan Xdebug + Webgrind atau XHProf untuk profil kode dan mengawasi pertanyaan ini: Cara terbaik untuk membandingkan kinerja tumpukan Drupal


Terima kasih telah memberi tahu saya tentang dampak beban, saya telah menggunakan jmeter tetapi kemudian lebih banyak menyiapkan rencana pengujian Anda, dll. Saya berharap dampak beban dapat menangani simulasi terautentikasi drupal.
Dipen

1

Saya suka pingdom untuk situs kecil / menengah karena ini berguna: memberi tahu Anda bahwa Ada yang Salah dari sudut pandang pelanggan, yang dapat ditindaklanjuti. Hal-hal seperti rata-rata pemuatan tidak benar-benar berarti apa-apa kecuali Anda memiliki tumpukan yang tidak terkonfigurasi dengan benar (yang seharusnya tidak Anda lakukan) atau Anda dipalu dari Digg / Reddit (dalam hal ini tidak ada yang dapat Anda lakukan, Anda harus memiliki siap).

Dari blog Ted Dziuba:

Singkatnya, saya menyebut lansiran jenis ini Cool Story, Bro. Ini adalah bit informasi yang tidak menunjukkan jenis masalah apa pun, dan jangan meminta tindakan apa pun. Cool Stories adalah hal-hal yang seharusnya tidak perlu Anda waspadai. Mereka menghabiskan waktu Anda dan membuat Anda paranoid. Peringatan Cool Story Bro adalah hal-hal seperti:

  • Rata-rata beban pada server di atas 20.
  • Antrian pekerjaan memiliki lebih dari X unit kerja di dalamnya. Selamat, sial, antrian Anda melakukan persis apa yang seharusnya dilakukan.
  • Beberapa metrik lebih besar dari rata-rata yang ditentukan secara empiris. Saya secara pribadi tersinggung oleh omong kosong seperti ini.

Baca posting blog, itu lucu.


0

Saya menggunakan check_drupal untuk memantau berbagai situs drupal. Ini adalah plugin nagios yang tidak memerlukan perubahan kode apa pun untuk situs drupal itu sendiri. Satu-satunya persyaratan adalah bahwa drush harus ada di server.

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.