Dalam ranah bot normal, semuanya tergantung pada apa yang Anda hargai dan hanya Anda yang bisa memutuskan itu. Tentu saja ada Google, Bing / MSN / Yahoo !, Baidu, dan Yandex. Ini adalah mesin pencari utama. Ada juga berbagai situs SEO dan backlink. Benar atau salah, saya mengizinkan beberapa yang besar memiliki akses ke situs saya, tetapi umumnya, itu adalah situs yang tidak berguna. Saya memblokir archive.org tidak hanya di robots.txt, tetapi dengan nama domain dan alamat IP. Ini karena mereka mengabaikan waktu robots.txt! Ini adalah sesuatu yang perlu Anda rasakan. Jangan tertipu oleh nama agen. Seringkali mereka ditempa oleh orang jahat. Sekarang, saya mendapat ribuan permintaan halaman dari sumber yang mengklaim sebagai Baidu, tetapi tidak. Kenali laba-laba ini dengan nama domain dan blok alamat IP dan pelajari cara menanganinya di tingkat itu. Yang baik mematuhi robots.txt.
Tapi saya harus memperingatkan Anda, ada TON bot siluman, bot nakal, pencakar, dan sebagainya sehingga Anda ingin sering mencari analisis log dan memblokir. 5uck5 ini! Tapi ini harus dilakukan. Ancaman terbesar dari mereka hari ini adalah tautan berkualitas rendah ke situs Anda. Kode keamanan anti-bot saya yang diperbarui yang saya terapkan tahun ini telah menjatuhkan 7700 tautan berkualitas rendah secara otomatis. Tentu saja, kode saya masih perlu bekerja, tetapi Anda mengerti maksudnya. Bot buruk masih mencuri potensi situs.
Tidak akan lama sebelum Anda terbiasa.