Meskipun ini adalah posting lama, membalas sekarang karena saya tahu nilai ambang check_load adalah sakit kepala besar untuk pemula ..;)
Peringatan peringatan, jika CPU 70% untuk 5 menit, 60% untuk 10 menit, 50% untuk 15 menit. Peringatan kritis, jika CPU 90% untuk 5 menit, 80% untuk 10 menit, 70% untuk 15 menit.
*command[check_load]=/usr/local/nagios/libexec/check_load -w 0.7,0.6,0.5 -c 0.9,0.8,0.7*
Semua temuan saya tentang beban CPU:
Apa yang dimaksud dengan "beban": Wikipedia mengatakan:
Semua sistem Unix dan Unix-like menghasilkan metrik tiga angka "rata-rata beban" di kernel. Pengguna dapat dengan mudah meminta hasil saat ini dari shell Unix dengan menjalankan perintah uptime:
$ uptime
14:34:03 up 10:43, 4 users, load average: 0.06, 0.11, 0.09
Dari rata-rata beban keluaran di atas: 0.06, 0.11, 0.09
means (pada sistem CPU tunggal):
- selama menit terakhir, CPU kekurangan muatan sebesar 6%
- selama 5 menit terakhir, CPU kekurangan muatan 11%
- selama 15 menit terakhir, CPU kekurangan beban 9%
.
$ uptime
14:34:03 up 10:43, 4 users, load average: 1.73, 0.50, 7.98
Rata-rata beban di atas 1.73 0.50 7.98
pada sistem CPU tunggal sebagai:
- selama menit terakhir, CPU kelebihan beban sebesar 73% (1 CPU dengan proses 1,73 runnable, sehingga 0,73 proses harus menunggu giliran)
- selama 5 menit terakhir, CPU kekurangan 50% (tidak ada proses yang harus menunggu giliran)
- selama 15 menit terakhir, CPU kelebihan beban 698% (1 CPU dengan proses runnable 7,98, sehingga proses 6,98 harus menunggu giliran)
Perhitungan nilai ambang nagios:
Untuk pengaturan Beban CPU Nagios, yang mencakup peringatan dan kritis:
y = c * p / 100
Dimana:
y = nagios value
c = number of cores
p = wanted load procent
untuk sistem 4 inti:
time 5 min 10 min 15 min
warning: 90% 70% 50%
critical: 100% 80% 60%
command[check_load]=/usr/local/nagios/libexec/check_load -w 3.6,2.8,2.0 -c 4.0,3.2,2.4
Untuk sistem inti tunggal:
y = p / 100
Dimana:
y = nagios value
p = wanted load procent
time 5 min 10 min 15 min
warning: 70% 60% 50%
critical: 90% 80% 70%
command[check_load]=/usr/local/nagios/libexec/check_load -w 0.7,0.6,0.5 -c 0.9,0.8,0.7
Buku putih yang hebat tentang analisis Beban CPU oleh Dr. Gunther http://www.teamquest.com/pdfs/whitepaper/ldavg1.pdf
Dalam artikel online ini Dr. Gunther menggali ke dalam kernel UNIX untuk mengetahui bagaimana rata-rata memuat ( "LA Triplets") dihitung dan seberapa tepat mereka sebagai metrik perencanaan kapasitas.
standard
atautested
nilai. Itu tergantung pada beban kerja server yang Anda harapkan. Jika Anda mengharapkan beban tinggi, Anda harus meningkatkan nilainya. Jika tidak, server Anda akan selalu muncul dalam kondisi kritis.