Situs web saya sedang DoS'ed oleh Google webspiders. Google dipersilakan untuk mengindeks situs saya, tetapi kadang-kadang meminta tagcloud di situs saya lebih cepat daripada server web saya dapat menghasilkan hasilnya, membuat server web saya kehabisan sumber daya.
Bagaimana saya bisa membatasi akses ke server web saya sedemikian rupa sehingga pengunjung normal tidak terpengaruh?
robots.txt bukan opsi karena akan memblokir seluruh situs agar tidak diindeks.
iptables -m recent
rumit, karena beberapa halaman memiliki banyak gambar atau file data lain dan pemicu 'baru' juga (biasanya agregator RSS saya, memuat gambar dan feed).
iptables -m limit
memiliki kelemahan yang sama dan di atas itu, saya tidak bisa selektif per alamat sumber IP.
Bagaimana saya bisa membatasi pengunjung yang menyebabkan beban server saya naik terlalu tinggi?
Saya menjalankan apache2 di server Ubuntu di VM VirtualBox.