Alat apa yang Anda gunakan untuk memonitor server Anda?


187

Untuk daftar alat pemantauan yang lebih komprehensif dan fitur-fiturnya, lihat halaman Wikipedia ini .

Seperti yang dinyatakan dalam pertanyaan, alat apa yang paling umum digunakan untuk tugas ini dan apa kekuatan dan kelemahannya?


Platform apa yang dijalankan server Anda?
Glenn Slaven

1
Server saya menjalankan Debian Lenny, tetapi pertanyaannya bukan hanya berfokus pada pemantauan UNIX saja karena banyak alat mungkin akan memiliki beberapa bentuk dukungan lintas platform.
Aron Rotteveel

Mungkin mereka menggunakan alat yang berbeda tetapi dari sudut pandang sistem secara keseluruhan Anda akhirnya melakukan hal yang sama berulang-ulang pada sistem yang berbeda. Hanya sedikit scripting untuk memeras data terakhir yang Anda inginkan. Saya akan mempertimbangkan "alat" dalam konteks ini rekaman contoh (monitoring server) tidak aktual plugin / script yang meludah keluar data
serverhorror

Saya juga suka memonitor aplikasi (kinerja, ketersediaan, dll). Alat pemantauan tampaknya memiliki spektrum dengan kemampuan mereka untuk memonitor perangkat keras di satu sisi dan kemampuan mereka untuk memonitor aplikasi di sisi lain. Perangkat Keras <----- + -----> Aplikasi
Nathan Hartley

Jawaban:


136

Saya telah menggunakan Nagios di masa lalu dengan sukses. Sangat mudah dikembangkan (lebih dari 200 add-on), relatif mudah digunakan dan banyak laporan. Negatif akan menjadi pengaturan awal.


10
Nagios berfungsi dengan baik untuk memonitor semua jenis host (Windows, Linux, Router, Switches, dll.) Saya sarankan menggunakan alat konfigurasi seperti fruity atau Lilacto untuk mengurangi rasa sakit konfigurasi. NSClient ++ pada kotak windows dan nagios-statd pada hal-hal linux untuk memantau proses yang sedang berjalan, penggunaan disk, dll.
TonyB

Sayangnya Nagios membutuhkan agen di kotak Windows - di masa lalu saya menemukan agen yang terkenal cenderung mati secara acak.
PowerApp101

Kami melihat Nagios dan Zabbix untuk pemantauan kami. Zabbix menang setelah evaluasi singkat, terutama karena kemudahan penyebaran dan fungsionalitas (misalnya, Zabbix termasuk grafik sebagai fungsi inti sementara Nagios membutuhkan plugin). Saya menemukan mengkonfigurasi nagios menjadi sakit.

GroundWork OpenSource memiliki alat pemantauan jaringan yang menggunakan Nagios pada intinya, dan menyederhanakan pengaturan / manajemen
Rog

12
Ada garpu nagios baru yang disebut icinga. Belum ada di mana-mana, tetapi tujuan mereka terlihat menjanjikan. icinga.org
cstamas

70

Cacti adalah antarmuka berbasis web yang sangat bagus untuk RRDTool , memberikan grafik dan statistik yang sangat berguna. RRDTool adalah bagian yang mengumpulkan data dari berbagai sistem dan memonitor berbagai data teknis.

Kami menggunakan solusi cacti / RRDTool untuk memantau sistem Unix dan Windows. Kami mendapatkan banyak metrik yang berguna termasuk beban, penggunaan CPU / RAM, ruang HD, pengguna yang masuk, lalu lintas jaringan, proses yang berjalan, dan sebagainya.

Anda akan menemukan informasi lebih lanjut tentang kaktus di bagian Apa itu Kaktus? halaman.


Cacti adalah solusi menyenangkan yang terlihat hebat dan harganya terjangkau (gratis). Namun, pengaturan perangkat jaringan adalah PITA dan kurang didokumentasikan. Mungkin lebih baik sekarang tapi saya tidak akan berkomitmen sampai Anda melakukan penelitian.
Chris Porter

57

Secara pribadi, saya suka Munin yang sangat mudah untuk menginstal dan menulis plugin karena memiliki arsitektur yang sangat mudah. Ada cukup banyak plugin yang sudah ada untuk semua tujuan yang dapat Anda bayangkan, jadi Anda mungkin tidak perlu lagi menulis plugin.

Ini juga menyediakan grafik yang indah dan opsi untuk mengkonfigurasi peringatan (sangat mendasar).


2
Saya penggemar berat Munin juga. Ini memiliki dukungan untuk berintegrasi dengan Nagios (sehingga Anda dapat menjalankan keduanya), dan dukungan untuk semua rasa umum unix. Saya tidak berpikir ada dukungan untuk memonitor node Windows - namun itu ditulis dalam Perl, jadi sementara itu mungkin non-sepele itu pasti harus dimungkinkan .
John Dalton

2
@ John Node Windows didukung melalui munin-node-win32 yang merupakan node munin asli, atau melalui SNMP sama seperti host mana pun.
Steve Schnepp

34

Zabbix . Ini open-source, dan cukup mudah untuk diatur dan dikustomisasi. Kami memiliki banyak skrip pemantauan khusus yang mengumpan ke server zabbix, tetapi kami harus memusatkan data tersebut, menampilkannya dengan tepat, pemberitahuan (email, IM, SMS, twitter, dll), dan sebagainya.


2
Kami juga menggunakan Zabbix dan merasa cukup kuat dan dapat dikonfigurasi. Kami menguji baik Zabbix dan Nagios dan memilih untuk Zabbix pada akhirnya karena sementara Nagios tampaknya memiliki reputasi yang baik, agak sulit untuk menginstal dan banyak fungsi berasal dari plugin daripada menampilkan dalam aplikasi inti (grafik adalah contoh bagus dari ini, Anda mendapatkannya secara gratis dengan Zabbix).

3
Saya lebih suka Zabbix karena fleksibilitas dalam hal grafik dan pemetaan infrastruktur Anda (dalam hal ketersediaan) serta cara pemantauan yang fleksibel.
Andrioid

29

Saya telah melakukan peluncuran Spiceworks di perusahaan kami dan kami menemukan itu menjadi alat yang hebat tidak hanya untuk memonitor server tetapi semua hal lain di jaringan.

Ia melakukan hal-hal seperti inventaris otomatis dan pemantauan khusus untuk mengirim Anda email ketika ada masalah (EG: Printer turun hingga 10% dari tinta atau hard drive server ini memiliki 20%).

Kelemahannya mungkin adalah kepadatan informasi per komputer, jangan salah ia memiliki BANYAK data per mesin tetapi untuk hal-hal seperti server di mana Anda mungkin ingin banyak statistik Anda mungkin perlu menggunakan alat lain.

EDIT: oh apakah saya menyebutkan model bisnisnya didasarkan di sekitar itu gratis selamanya.


Spiceworks melakukan banyak hal yang luar biasa - dan GRATIS.

3
SpiceWorks memiliki komunitas yang sangat besar yang tumpang tindih dengan ServerFault juga. Akan menarik untuk melihat interaksi antara komunitas. Saya menggunakan SpiceWorks juga. Alat luar biasa.
Scott Alan Miller

Saya sekarang menggunakan ini berdasarkan rekomendasi Anda. Alat luar biasa.
Marko Carter

Kami menggunakannya di tempat kerja kami. Ini cukup mengesankan. Persediaan perangkat keras saja, belum lagi perangkat lunak, patut dilihat sendiri.
Terry

Terakhir kali saya menggunakan Spiceworks (versi 3 sesuatu), itu tidak memiliki cara untuk menambah atau memodifikasi komponen perangkat keras seperti monitor, kartu video, dll. Ini akan mendeteksi mereka, tetapi seringkali salah. Jadi saya masih menggunakan GLPI + OCSNG yang saya benci .
Boden

18

Smokeping tidak hanya memeriksa ketersediaan berbagai server dan layanan tetapi juga melacak latensi mereka sambil memberikan kemudahan penggunaan, tampilan yang bagus, dan grafik tampilan yang cepat .

Berbagai macam plugin pengukuran latensi tersedia di luar kotak. Jika Anda mengenal beberapa Perl, mudah untuk membuatnya sendiri untuk kebutuhan eksotis.

Instalasi besar akan mendapat manfaat dari Sistem Master / Slave untuk pengukuran terdistribusi.

Sistem peringatan yang sangat dapat dikonfigurasi akan membantu Anda melihat masalah sebelum mereka mulai mempengaruhi pengguna atau berevolusi menjadi pemadaman besar.

Smokeping adalah Perangkat Lunak OpenSource gratis dan ditulis dalam Perl oleh Tobi Oetiker, pencipta MRTG dan RRDtool


Smokeping baik untuk melihat seperti apa jaringan Anda
Rory

Perokok luar biasa untuk memvisualisasikan latensi.
James

15

OpenNMS digunakan di mana saya bekerja untuk memantau lebih dari seribu mesin Linux. Kami memantau perangkat keras masing-masing mesin dan aplikasi yang menjalankannya.


+1 untuk OpenNMS, kami juga menggunakan ini untuk memonitor ribuan mesin dan antarmuka. Kami memiliki banyak sistem operasi yang berbeda, dan kami dapat memonitor semuanya menggunakan OpenNMS.
Steve K

bukan pilihan pertama saya tetapi sangat berguna

bagaimana dengan menambahkan MIB untuk perangkat keras baru?
slovon

OpenNMS memiliki banyak statistik snmp yang sudah dalam konfigurasi default sehingga dapat ditemukan secara otomatis dan mulai membuat grafik di luar kotak. Statistik SNMP baru cukup mudah untuk ditambahkan, cukup beri nama untuk RRD, OID dan tipe data dan letakkan di grup untuk jenis perangkat yang digunakan stat.
mtinberg

15

Zenoss Core ada gunanya, Kami menggunakannya (sekitar satu tahun) untuk pemantauan server yang ringan, sakelar bersih, dan UPS.

Zenoss Core adalah produk pemantauan TI open source pemenang penghargaan yang secara efektif mengelola konfigurasi, kesehatan, dan kinerja jaringan, server, dan aplikasi melalui satu paket perangkat lunak terintegrasi.


Jika Anda menggunakan versi gratis Zenoss Core, bersiaplah untuk melakukan banyak tweaker SNMP MIB. Saya juga menemukan bahwa ia terus menolak untuk mengumpulkan data sistem operasi pada beberapa server saya, dan secara mengejutkan sulit untuk diatur untuk tugas-tugas sederhana seperti memeriksa isi halaman Web.
gareth_bowles

Dapat bersimpati dengan masalah MIB, tetapi pemeriksaan halaman web dapat dilakukan dengan plugin Nagios di Zenoss.
gimel

12

Nagios luar biasa karena gratis dan ada banyak plugin untuk itu. Namun UI dan konfigurasi sangat sulit.

Ini kebalikan dari pro / kontra yang juga hebat adalah Microsoft System Center Operations Manager (SCOM) yang tidak gratis, memiliki lebih sedikit plugin tetapi pengaturan dan konfigurasi yang brilian dan mudah.

Saya harus mengakui jika saya berada di sebuah perusahaan Microsoft terutama, memiliki persyaratan ketergantungan yang sangat tinggi (yaitu tidak mampu untuk memantau untuk istirahat) atau harus berpikir tentang membuat pengembang untuk bekerja dengannya maka SCOM akan menjadi rekomendasi saya atas Nagios.


12

Saya telah menggunakan:

  • Nagios - membutuhkan pengaturan baris perintah yang sudah lama, tidak cantik, tetapi kokoh dan fungsional. Telah digantikan oleh:
  • Zenoss - membutuhkan jauh lebih sedikit gerak kaki untuk menyiapkan, memiliki varian komersial. Setelah berjalan, sisanya dikontrol melalui browser. Sangat kuat, tetapi membutuhkan kerja MIB jika Anda menggunakan versi gratisnya.
  • Intermapper - program komersial, boros jika Anda memiliki banyak node untuk dipantau. Tampaknya ditulis dalam Java (baik atau buruk).
  • Spiceworks - belum mencoba versi terbaru. Versi yang lebih lama membutuhkan sedikit lebih banyak umph di bawah tenda untuk membuatnya merespons, tetapi jika tidak, ia berfungsi dengan baik. Versi gratis dilengkapi dengan iklan cerewet.

Kami menggunakan Intermapper secara luas.
sysadmin1138

Saya menggunakan InterMapper juga. Klien konsol ditulis dalam Java. Server ditulis dengan Python. Postgres digunakan sebagai database backend untuk agregasi dan pelaporan data.
lsiu

11

Kami menggunakan AlertFox sejak beberapa minggu dan sangat senang. Ini tidak hanya memeriksa waktu kerja dan kinerja kami, tetapi juga memantau keranjang belanja, login pengguna, dan bagian penting lainnya dari situs web melalui skrip transaksi (berbasis iMacros).

Untuk pemantauan internal kami (ruang disk, dll.) Kami menggunakan Nagios .


10

Monitor Jaringan PRTG - tidak dapat mengatakan cukup banyak hal hebat tentang itu. Web front end yang luar biasa dan sangat bagus untuk memonitor router (bandwidth dll) dan perangkat lain melalui SNMP dan mengukur uptime untuk SLA, dll.

www.paessler.com


9

Sebagai orang Windows, MOM. Kami mencari untuk meningkatkan ke System Center Operations Manager (SCOM) tetapi tidak perlu sampai kami mulai menggunakan Windows 2008.


Saya menggunakan IBU juga. Saya menyukainya dan membencinya pada saat yang sama.
spoulson

SCOM adalah platform pemantauan hebat untuk lingkungan Perusahaan berbasis Windows. Jenius sejati di sini adalah Paket Manajemen yang dirilis oleh kelompok produk Microsoft sendiri (ini adalah bagian dari Kriteria Umum Teknik MS bahwa setiap produk memiliki MP SCOM dalam waktu 90 hari sejak RTM). Mendapatkan saran dan pengetahuan dari tim produk sendiri dapat sangat meningkatkan kemampuan departemen operasi untuk menjaga semuanya berjalan dan sehat tanpa mengganggu admin yang lebih senior untuk setiap hal kecil.
Kevin Colby

8

Saya bagian dari proyek peningkatan pemantauan operasional. Kami memiliki berbagai vendor yang datang untuk menyajikan beberapa sistem dolar besar dan dicampur dalam beberapa alternatif yang lebih murah untuk dibandingkan.

Salah satunya adalah Hyperic , yang juga tersedia sebagai solusi open source gratis. Saya terkesan dengan kemampuan yang diberikan dan ekstensibilitas untuk agen kustom.


Meskipun tidak mudah pada sumber daya, itu pasti merupakan alat pemantauan yang hebat!
Vincent De Baere

8

Untuk memantau statistik (penggunaan memori, memuat, aktivitas mysql, aktivitas apache, dll.) Saya menggunakan Munin . Di luar kotak itu sudah melacak banyak hal dan plot grafik untuk interval waktu yang berbeda (24 jam terakhir, 7 hari terakhir, bulan lalu, tahun lalu). Melalui plugin, lebih banyak hal dapat dipantau. Outputnya adalah halaman HTML dengan grafik cantik.

Munin memiliki arsitektur master / node: node mengumpulkan statistik di server dan master menyimpan data dan menghasilkan HTML dan grafik.

Saya menggunakan Monit untuk melacak proses yang berjalan dan untuk me-restart atau mengingatkan saya ketika kondisi yang dapat dikonfigurasi tertentu muncul (beban cpu tinggi, penggunaan memori tinggi, tidak ada respons HTTP, dll.) Monit juga dapat memantau hal-hal yang lebih umum tentang server, seperti cpu memuat, penggunaan memori, status harddisk atau penggunaan disk.

Monit perlu dikonfigurasi untuk setiap layanan atau perangkat keras yang ingin Anda pantau dan bagaimana merespons ketika terjadi kesalahan. Opsi yang paling banyak digunakan adalah tidak melakukan apa-apa, mengirim email peringatan atau memulai kembali layanan.

Monit bagus ketika berfungsi, tetapi terkadang gagal untuk memulai, menghentikan atau memulai kembali layanan dan tidak ada banyak informasi diagnostik yang tersedia untuk memberi tahu Anda apa yang salah. Ini berarti Anda tidak tahu apakah masalahnya dengan layanan Anda atau dengan konfigurasi Monit, yang berjalan dengan lingkungan minimal seperti cron.

Kedua alat tersedia secara default di sebagian besar distribusi Linux.


8

Saya terkejut tidak ada yang menyebutkan logwatch atau logcheck untuk server linux - menghemat satu ton waktu membaca log !!


Alat-alat itu tidak akan benar-benar memberi Anda metrik dan keterbacaan jangka panjang dari tren infrastruktur Anda. Mereka adalah tambahan yang bagus tapi saya tidak akan hanya mengandalkan mereka. Afaik "logwatch" agak jahat karena hanya akan melaporkan tentang kesalahan yang Anda ceritakan sebagai kebalikan dari "logcheck" di mana Anda memberi tahu alat itu barang bagus dan akan melaporkan yang lainnya.
serverhorror


7

Proyek kami menggunakan Ganglia untuk 100+ kelompok simpul kami. Salah satu alasan kami menggunakannya adalah karena alat pemantauan yang datang dengan Rocks .

Sangat penting bagi kita untuk memiliki overhead yang sangat rendah pada setiap node sehingga sumber daya sebanyak mungkin tersedia untuk perhitungan. Ganglia memberi kami gambaran umum yang baik tentang cluster dan memungkinkan kami untuk menelusuri setiap node jika diperlukan. Selain tahu apa yang sedang terjadi saat ini, kita bisa melihat apa yang terjadi selama satu jam, hari, minggu, bulan, dan tahun terakhir. Grafik berbagai statistik adalah dasar dan fungsional.


6

Itu semua tergantung apa yang Anda maksud dengan "monitor"!

  • Apakah ini (sistem atau layanan) tersedia? Kami menggunakan nagios .
  • Apa yang sedang dilakukannya? Kami menggunakan munin untuk server linux, dan kaktus untuk hampir semua hal lain, meskipun terkadang sulit untuk mengkonfigurasi ...
  • Apa yang telah dilakukan Kami menggunakan syslog-ng untuk memusatkan syslog di satu tempat dan kemudian menjalankan skrip cek log yang disesuaikan setiap hari untuk mengirim laporan melalui email. Kami mencari yang serupa untuk server Windows.

5

Peserta baru di lokasi untuk bersaing dengan Cacti dan solusi berbasis RRDTool adalah Graphite ( http://graphite.wikidot.com/ )

RRDTool diganti dengan toko dukungan yang disebut Whisper. Dokumen memberikan gambaran yang cukup bagus tentang mengapa itu berbeda dan saya sangat suka CLI untuk grafik ad hoc ketika menyelidiki sesuatu.


4

Kami menggunakan (dan menyukai) WhatsUp dari Ipswitch untuk jaringan Windows kami yang relatif kecil. Mudah diatur, dan relatif mudah dikelola, serta tahu cara menangani server Windows serta hal-hal standar.

Untuk jaringan yang lebih besar, jaringan yang tidak berorientasi Windows, atau jaringan dengan banyak hal yang bervariasi, saya sungguh-sungguh merekomendasikan OpenNMS . Perangkat lunak OpenNMS jika gratis dan perusahaan lebih dari senang untuk menjual dukungan dan layanan implementasi. Itu juga kebetulan dijalankan oleh teman saya yang sangat tajam dari perguruan tinggi!


4

Bagi mereka yang tidak suka antarmuka web Nagios ada NPC , sebuah plugin untuk Cacti yang membuat Nagios UI tersedia dari dalam Cacti, tetapi dengan tampilan yang lebih baik (ajax dll.).

Bunyinya dari database yang disediakan oleh NDO2DB , yang merupakan cara terbaik untuk memiliki infrastruktur Anda tersedia dari dalam database untuk digunakan dalam skrip dan alat lainnya.


4

Saat ini kami menggunakan PRTG dari Paessler . Ini luar biasa. Tidak diperlukan agen, antarmuka web Ajax yang luar biasa, pencatatan historis, grafik, WMI, dll. Ada versi 10 sensor yang tersedia secara gratis, tetapi kami merobohkan beberapa grand untuk versi perusahaan. Uang dibelanjakan dengan baik.



4

Jika Anda terburu-buru dan ingin alat cepat untuk memonitor server MS Anda kemudian gunakan monitor kinerja untuk windows, buat log penghitung dengan templat pemantauan khusus dan jadwal custome (mis: mengumpulkan data selama 5 menit setiap jam). Kemudian unduh Microsoft LogParser dan Codeplex's Performance Analysis of Logs (PAL) Tool ( http://pal.codeplex.com/ ) untuk menghancurkan log penghitung Anda. PAL akan menghasilkan laporan terdokumentasi yang bagus dengan tautan ke kemungkinan dokumen / alat penyelesaian masalah.


3

Saya menggunakan kombinasi Solarwinds, tab kinerja server VMware, dan skrip khusus.

Solarwinds Orion Network Performance Monitor adalah apa yang saya gunakan dengan sistem Windows kami. admin di server web saya. Masih menjalankan beberapa metrik aplikasi yang berguna, tetapi ia memiliki informasi bagus tentang hal-hal tingkat kotak dasar (disk, jaringan, CPU).

Untuk tamu VMware saya, saya suka tab kinerja.

Untuk server Sun saya, ketika saya membutuhkan sesuatu yang tidak tersedia di Solarwinds (karena admin kami belum menambahkannya atau apa), saya menulis skrip khusus (biasanya dalam Perl) untuk memantau hal-hal seperti kesehatan cermin, penggunaan swap, dll.

Saya ingin mendapatkan lebih banyak ke Solarwinds, tetapi hanya ada sekitar 26 jam dalam sehari (atau jadi bos saya percaya) jadi saya menemukan itu bisa sedikit membatasi ...


3

Kami menggunakan OpsView , yang berjalan di atas Nagios. WebUI membantu kami menggunakan definisi monitor host baru tanpa harus mengizinkan akses SSH, memberikan pandangan publik, dan mencatat nilai historis. Ini berguna untuk membuat dan menentukan baseline yang cocok.



2

Maaf untuk mengatakan tetapi saya akhirnya menggunakan banyak skrip khusus. Meskipun jauh dari ideal, saya ragu ada solusi yang lebih umum.


Akan selalu ada kebutuhan untuk skrip khusus!
Techboy

2

Kami telah menulis perangkat lunak pemantauan kami sendiri. Kode kami hampir tidak secanggih paket komersial, tetapi kami tidak membutuhkan banyak fungsionalitas. Lebih mudah menulis sendiri daripada menyelidiki paket lain dan belajar cara menggunakannya. Kode melakukan apa yang kita inginkan dan mudah diperluas.


2
Saya pikir penting untuk memikirkan implikasi dari keputusan seperti ini. Untuk menulis sesuatu dari awal mungkin tidak terlalu sulit - tetapi pemeliharaan di jalan adalah beruang.
Adam

Saya bisa membayangkan pemeliharaan menjadi masalah, tetapi itu bukan untuk kami, meskipun kami telah menjalankan sistem ini selama bertahun-tahun. Karena basis kode kecil dan familier, mudah bagi kami untuk menambahkan fungsionalitas baru sesuai kebutuhan. Mempertahankan solusi komersial juga bisa menjadi masalah dari waktu ke waktu, mencangkok potongan-potongan dari vendor baru ketika produk asli tidak melakukan semua yang Anda butuhkan, dll.
John D. Cook
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.