Memantau aplikasi C ++

10

Kami menerapkan solusi pemantauan terpusat baru (Zenoss). Memasukkan server, jaringan, dan program Java sangat mudah dengan SNMP dan JMX.

Namun, pertanyaannya adalah apakah praktik terbaik untuk memantau dan mengelola aplikasi C ++ khusus di lingkungan besar, heterogen (Solaris x86, RHEL Linux, Windows)?

Kemungkinan yang saya lihat adalah:

SNMP bersih

Keuntungan

satu, pusat daemon di setiap server
standar terkenal
integrasi yang mudah ke dalam solusi pemantauan
kami sudah menjalankan Net SNMP daemon di server kami

Kekurangan:

implementasi kompleks (MIB, pustaka SNMP Net)
teknologi baru yang akan diperkenalkan untuk pengembang C ++

rsyslog

Keuntungan

satu, pusat daemon di setiap server
standar terkenal
integrasi yang tidak diketahui ke dalam solusi pemantauan (saya tahu mereka bisa melakukan peringatan berdasarkan teks, tetapi seberapa baik kerjanya untuk mengirim telemetri seperti penggunaan memori, kedalaman antrian, kapasitas utas, dll.)
implementasi sederhana

Kekurangan:

kemungkinan masalah integrasi
teknologi yang agak baru untuk pengembang C ++
kemungkinan masalah porting jika kami beralih dari vendor pemantauan
mungkin melibatkan pembuatan protokol komunikasi ad-hoc (atau menggunakan data terstruktur RFC5424; saya tidak tahu apakah Zenoss mendukungnya tanpa pengkodean Zenpack kustom)

Embedded JMX (embed JVM dan gunakan JNI)

Keuntungan

antarmuka manajemen yang konsisten untuk Java dan C ++
standar terkenal
integrasi yang mudah ke dalam solusi pemantauan
implementasi agak sederhana (kami sudah melakukan ini hari ini untuk keperluan lain)

Kekurangan:

kompleksitas (JNI, lapisan pemunculan antara asli C ++ dan Java, pada dasarnya menulis kode manajemen dua kali)
kemungkinan masalah stabilitas
membutuhkan JVM di setiap proses, menggunakan memori jauh lebih banyak
JMX adalah teknologi baru untuk pengembang C ++
setiap proses memiliki port JMX sendiri (kami menjalankan banyak proses pada setiap mesin)

Daemon JMX lokal, proses terhubung ke sana

Keuntungan

satu, pusat daemon di setiap server
antarmuka manajemen yang konsisten untuk Java dan C ++
standar terkenal
integrasi yang mudah ke dalam solusi pemantauan

Kekurangan:

kompleksitas (pada dasarnya menulis kode manajemen dua kali)
perlu menemukan atau menulis daemon semacam itu
membutuhkan protokol antara daemon JMX dan proses C ++
JMX adalah teknologi baru untuk pengembang C ++

Ion CodeMesh JunC ++

Keuntungan

antarmuka manajemen yang konsisten untuk Java dan C ++
standar terkenal
integrasi yang mudah ke dalam solusi pemantauan
daemon pusat tunggal pada setiap server ketika dijalankan dalam mode JVM bersama
implementasi yang agak sederhana (memerlukan pembuatan kode)

Kekurangan:

kompleksitas (pembuatan kode, membutuhkan GUI dan beberapa putaran penyesuaian untuk menghasilkan kode yang diproksi)
kemungkinan masalah stabilitas JNI
membutuhkan JVM di setiap proses, menggunakan jauh lebih banyak memori (dalam mode tertanam)
Tidak mendukung Solaris x86 (deal breaker)
Bahkan jika itu mendukung Solaris x86, ada kemungkinan masalah kompatibilitas kompiler (kami menggunakan kombinasi aneh STLPort dan Forte on Solaris
setiap proses memiliki port JMX sendiri saat dijalankan dalam mode tertanam (kami menjalankan banyak proses pada setiap mesin)
mungkin menghalangi server JMX bersama untuk proses non-C ++ (?)

Apakah ada beberapa solusi sederhana yang distandarisasi dan sederhana yang saya lewatkan?

Karena tidak ada solusi masuk akal lainnya, manakah dari solusi ini yang biasanya digunakan untuk program C ++ khusus?

Perasaan saya adalah bahwa SNMP Net adalah cara orang melakukan ini, tetapi saya ingin masukan dan pengalaman orang lain sebelum saya mengambil keputusan.

java c++

— Scott A
sumber

1

Saya tidak super akrab dengan Zenoss tetapi ketika saya dulu menggunakan nagios untuk hal semacam ini kami akan membuat proses c / c ++ mendengarkan pada soket dan menulis plugin nagios khusus yang akan menyerahkan informasi status dan diagnostik.

Langkah pertama adalah memilih lib yang ingin Anda gunakan untuk membuat proses Anda mendengarkan .. Sesuatu seperti C ++ Socket Library akan lakukan untuk itu. Tidak ada yang rumit di sana .. cukup buat proses mendengarkan.

Maka Anda harus mendefinisikan respons yang akan dikirim oleh proses Anda dengan diberikan stimulus tertentu. Ini benar-benar berarti (paling tidak dengan nagios) mendefinisikan 'layanan' dan kemudian mengirimkan proses sinyal yang sesuai dengan layanan itu. Hal paling sederhana yang dapat Anda lakukan adalah membuat 'proses ping', lihat saja apakah Anda berhasil terhubung ke proses yang sedang berjalan. Jika Anda melakukannya daripada plugin nagios khusus tahu setidaknya prosesnya masih hidup.

Ada banyak hal yang lebih canggih yang dapat Anda lakukan tetapi idenya cukup sederhana. Anda dapat menulis lib kecil Anda sendiri dari proses mendengarkan kode yang dienkapsulasi dalam objek dan menariknya ke item c ++ kustom Anda dengan cara standar setiap kali Anda membangun satu (atau semua) executable Anda

Pemahaman saya adalah Zenoss dapat melakukan ini juga .

Mungkin karena Zenoss adalah python maka Anda akan menulis plugin khusus untuknya menggunakan sesuatu seperti Twisted untuk menghubungkan ke c ++ yang dapat dieksekusi yang dapat dieksekusi.

— Uncjamil
sumber

1

saya tidak akrab dengan produk-produk ini, tetapi untuk windows saya memantau konsumsi memori menggunakan perfmon, ada beberapa counter khusus, seperti kesalahan pool non-paged, yang menunjukkan kepada Anda jika program Anda mengandung kebocoran memori, mereka mungkin sedikit dan dengan demikian membutuhkan waktu lama waktu untuk memantau tetapi menurut saya ini metode pemeriksaan sederhana.

Pada windows Anda dapat melakukan banyak hal menggunakan perfmon, bahkan dari jarak jauh Atau memanfaatkan WMI untuk melampirkan penghitung yang sama, dan melakukan beberapa otomatisasi di atasnya (dalam wmi) untuk melakukan tindakan.

— pengguna613326
sumber

1

Saya memahami hal ini karena kami baru-baru ini melalui proses yang sama seperti Anda: Kami mencari solusi open-source yang ringan, tanpa pemblokiran, yang memungkinkan pemaparan dan pemantauan jarak jauh berikutnya dari metrik dari dalam layanan C / C ++ ( kami memiliki sekitar ~ 3000).

SNMP datang paling dekat tetapi integrasi ke dalam sumber dan sistem pemantauan sangat merepotkan dan tidak cocok untuk proses waktu nyata kami.

Pada akhirnya, kami memutuskan untuk mengembangkan solusi baru yang disebut CMX yang menggunakan teknologi memori bersama dan menjadikannya open-source. Anda dapat memeriksanya di sini: www.cern.ch/cmx .

— Felix Ehm
sumber

0

Saya tidak super akrab dengan sisi c ++ tetapi di Jawa kami banyak menggunakan metrik CodaHale dalam hubungannya dengan Graphite . CodaHale menyimpan metrik pada basis per instance di memori lokal instance lalu menggunakan utas latar untuk membilas metrik ke server grafit setiap menit (dapat dikonfigurasi). Dalam grafit kita dapat mengumpulkan di seluruh instance serta mengidentifikasi contoh yang salah. Jika Anda tidak ingin kompleksitas mempertahankan cluster grafit, Anda dapat menggunakan HostedGraphite .

Penyiapan ini berarti tidak ada titik tunggal kegagalan untuk agregasi metrik atau pelaporan sebagai (agregasi berbasis waktu terjadi pada node itu sendiri dan agregasi pelaporan di seluruh terjadi dalam gugus grafit terdistribusi (atau grafit yang dihosting).

Terakhir, Anda dapat menggunakan Seyren untuk memberikan peringatan di atas data pemantauan.

— Usman Ismail
sumber

0

Jika Anda menggunakan Windows, Anda cenderung menulis ke log peristiwa, dan kemudian menggunakan WMI atau proses serupa untuk membaca acara tersebut. Jika Anda ingin memantau, Anda menambahkan penghitung monitor kinerja ke aplikasi Anda dan biarkan perfmon membacanya. Keduanya adalah layanan sistem di Windows.

Di Linux, itu jelas cenderung lebih fleksibel, tetapi saya selalu melihat monitor gaya nagios diimplementasikan, dengan soket kustom mengirim data ke server gaya nagios.

Itu semua mengatakan, saya telah melihat beberapa tempat di mana SMNP digunakan, dan terus terang, saya tidak bisa melihat alasan mengapa Anda tidak menggunakannya - terutama jika Anda menjalankan lingkungan yang sepenuhnya heterogen.

— gbjbaanb
sumber