Jika Anda merasa bahwa mereka merayapi situs Anda secara berlebihan (bahkan mungkin kehilangan konten yang lebih dalam), Anda harus memastikan bahwa tajuk HTTP Anda mengembalikan nilai yang baik untuk hal-hal seperti waktu 'modifikasi terakhir', dll. Mungkin Googlebot melebih-lebihkan seberapa besar perubahan situs Anda . Sebagai bonus, situs Anda akan berperilaku lebih baik dalam hal caching (baik itu berbasis proxy atau browser) dan karenanya terasa sedikit lebih cepat.
Anda sebaiknya mempelajari URL apa yang sedang dirayapi (dengan meninjau log server Anda). Jika mereka menyusun kembali URL yang sama berulang-ulang, Anda pasti memiliki masalah. Varian umum pada ini adalah jika Anda memiliki halaman yang dapat ditampilkan dalam berbagai cara menggunakan variabel permintaan. Googlbot dapat mencoba merangkak setiap kemungkinan kombinasi dari variabel-variabel tersebut.
Contoh yang saya temui sebagai operator perayapan adalah laman yang memiliki daftar dua puluh judul, kombinasi apa pun yang dapat diperluas. Pada dasarnya, halaman itu memiliki 2 ^ 20 URL berbeda!
Pastikan Googlebot tidak terjebak merangkak pada dasarnya halaman yang sama berulang-ulang dengan parameter yang sangat berbeda (saya pernah melihatnya terjebak dalam hal ini)