Meskipun menjadi alat yang hebat, Munin dan frontend RRDTool lainnya (seperti Cacti atau Ganglia) telah mengetahui masalah i / o dan sulit untuk diukur ketika Anda memonitor kumpulan node.
Ada beberapa teknik untuk mengatasi bottleneck i / o ini. Salah satu teknik ini adalah untuk menyebar tulis ke sejumlah besar disk untuk mengurangi i / o di setiap disk. Di sisi lain, banyak sysadmin menggunakan sistem file tmpfs untuk menangani masalah ini. RRDCached juga merupakan opsi yang baru dan bagus untuk mengatasi hal ini dan saya sarankan Anda melihat slide ini .
Saya tidak begitu akrab dengan Munin, tetapi Cacti memiliki plugin Boost . Plugin ini menyimpan data dalam memori dan melakukan pembaruan massal dan sesuai permintaan ke disk, alih-alih menulis individual, sehingga mengurangi i / o. Saya cukup yakin bahwa Munin juga memiliki sesuatu seperti ini.
Jika Anda mampu membelinya, disk SSD juga merupakan opsi yang baik.
Last but not least, Anda juga bisa melihat Reconnoiter . Recconoiter adalah alat deteksi kesalahan dan grafik / tren terbaru. Tidak seperti alat yang paling trending, Reconnoiter bukan RRDTool dan mencoba untuk menyelesaikan masalah khusus ini. Saya tidak menggunakan Reconnoiter dalam produksi, tetapi saya telah melakukan beberapa tes, dan meskipun masih sedikit "hijau", terlihat sangat menjanjikan, terutama mengenai skalabilitasnya.
Semoga ini membantu!