Mengapa baidu merayapi situs saya seperti orang gila


12

Ketika saya memeriksa log apache saya, saya dapat melihat bahwa baidu telah merayapi situs web saya 10 kali sehari selama 2 minggu terakhir.

Bukannya aku terlalu peduli tapi aku sangat penasaran mengapa dia melakukan ini. Ini adalah situs web satu halaman yang sangat kecil dengan tidak banyak tautan masuk.

Apakah ada alasan di balik itu?

220.181.108.169 [10/Mar/2012:10:41:29 +0100] "GET / ... +http://www.baidu.com/search/spider.html)"
180.76.5.197 [10/Mar/2012:11:02:02 +0100] "GET / ...robots.txt +(+http://www.baidu.com/search/spider.htm)"
123.125.71.100 [10/Mar/2012:11:33:15 +0100] "GET / ... +http://www.baidu.com/search/spider.html)"
220.181.108.167 [10/Mar/2012:11:33:52 +0100] "GET / ... +http://www.baidu.com/search/spider.html)"
123.125.71.116 [10/Mar/2012:12:24:48 +0100] "GET / ... +http://www.baidu.com/search/spider.html)"
220.181.108.172 [10/Mar/2012:12:25:05 +0100] "GET / ... +http://www.baidu.com/search/spider.html)"
123.125.71.111 [10/Mar/2012:13:33:22 +0100] "GET / ... +http://www.baidu.com/search/spider.html)"
220.181.108.167 [10/Mar/2012:13:34:03 +0100] "GET / ... +http://www.baidu.com/search/spider.html)"
220.181.108.168 [10/Mar/2012:14:12:05 +0100] "GET / ... +http://www.baidu.com/search/spider.html)"
123.125.71.107 [10/Mar/2012:14:23:41 +0100] "GET / ... +http://www.baidu.com/search/spider.html)"
220.181.108.176 [10/Mar/2012:14:23:58 +0100] "GET / ... +http://www.baidu.com/search/spider.html)"
123.125.71.94 [10/Mar/2012:15:25:59 +0100] "GET / ... +http://www.baidu.com/search/spider.html)"
220.181.108.183 [10/Mar/2012:15:26:21 +0100] "GET / ... +http://www.baidu.com/search/spider.html)"
123.125.71.92 [10/Mar/2012:17:45:55 +0100] "GET / ...robots.txt +http://www.baidu.com/search/spider.html)"
123.125.71.71 [10/Mar/2012:17:45:57 +0100] "GET / ...robots.txt +http://www.baidu.com/search/spider.html)"
123.125.71.79 [10/Mar/2012:17:46:04 +0100] "GET / ...robots.txt +http://www.baidu.com/search/spider.html)"
123.125.71.103 [10/Mar/2012:17:47:32 +0100] "GET / ... +http://www.baidu.com/search/spider.html)"
220.181.108.179 [10/Mar/2012:17:48:37 +0100] "GET / ... +http://www.baidu.com/search/spider.html)"
123.125.71.108 [10/Mar/2012:18:37:21 +0100] "GET / ... +http://www.baidu.com/search/spider.html)"
220.181.108.185 [10/Mar/2012:18:38:13 +0100] "GET / ... +http://www.baidu.com/search/spider.html)"
123.125.71.96 [10/Mar/2012:19:25:50 +0100] "GET / ... +http://www.baidu.com/search/spider.html)"
220.181.108.169 [10/Mar/2012:19:25:59 +0100] "GET / ... +http://www.baidu.com/search/spider.html)"
123.125.71.101 [10/Mar/2012:20:25:51 +0100] "GET / ... +http://www.baidu.com/search/spider.html)"
220.181.108.176 [10/Mar/2012:20:26:09 +0100] "GET / ... +http://www.baidu.com/search/spider.html)"
123.125.71.105 [10/Mar/2012:21:33:38 +0100] "GET / ... +http://www.baidu.com/search/spider.html)"
220.181.108.178 [10/Mar/2012:21:34:15 +0100] "GET / ... +http://www.baidu.com/search/spider.html)"
180.76.5.170 [10/Mar/2012:21:57:39 +0100] "GET / ... +http://www.baidu.com/search/spider.html)"
123.125.71.98 [10/Mar/2012:22:26:13 +0100] "GET / ... +http://www.baidu.com/search/spider.html)"
220.181.108.175 [10/Mar/2012:22:26:33 +0100] "GET / ... +http://www.baidu.com/search/spider.html)"
123.125.71.104 [10/Mar/2012:23:34:09 +0100] "GET / ... +http://www.baidu.com/search/spider.html)"
220.181.108.169 [10/Mar/2012:23:34:48 +0100] "GET / ... +http://www.baidu.com/search/spider.html)"
220.181.108.171 [10/Mar/2012:23:52:22 +0100] "GET / ... +http://www.baidu.com/search/spider.html)"
220.181.108.168 [10/Mar/2012:23:52:22 +0100] "GET / ... +http://www.baidu.com/search/spider.html)"
123.125.71.110 [11/Mar/2012:00:33:52 +0100] "GET / ... +http://www.baidu.com/search/spider.html)"
220.181.108.184 [11/Mar/2012:00:34:27 +0100] "GET / ... +http://www.baidu.com/search/spider.html)"
123.125.71.103 [11/Mar/2012:02:37:21 +0100] "GET / ... +http://www.baidu.com/search/spider.html)"
220.181.108.177 [11/Mar/2012:02:37:58 +0100] "GET / ... +http://www.baidu.com/search/spider.html)"
123.125.71.97 [11/Mar/2012:03:34:30 +0100] "GET / ... +http://www.baidu.com/search/spider.html)"
220.181.108.172 [11/Mar/2012:03:35:07 +0100] "GET / ... +http://www.baidu.com/search/spider.html)"
123.125.71.107 [11/Mar/2012:04:35:33 +0100] "GET / ... +http://www.baidu.com/search/spider.html)"
220.181.108.178 [11/Mar/2012:04:36:16 +0100] "GET / ... +http://www.baidu.com/search/spider.html)"
123.125.71.115 [11/Mar/2012:05:34:31 +0100] "GET / ... +http://www.baidu.com/search/spider.html)"
220.181.108.187 [11/Mar/2012:05:35:12 +0100] "GET / ... +http://www.baidu.com/search/spider.html)"
123.125.71.97 [11/Mar/2012:06:24:17 +0100] "GET / ... +http://www.baidu.com/search/spider.html)"
220.181.108.181 [11/Mar/2012:06:24:32 +0100] "GET / ... +http://www.baidu.com/search/spider.html)"
123.125.71.112 [11/Mar/2012:07:40:27 +0100] "GET / ... +http://www.baidu.com/search/spider.html)"
220.181.108.187 [11/Mar/2012:07:41:17 +0100] "GET / ... +http://www.baidu.com/search/spider.html)"
123.125.71.95 [11/Mar/2012:08:29:42 +0100] "GET / ... +http://www.baidu.com/search/spider.html)"
220.181.108.175 [11/Mar/2012:08:30:07 +0100] "GET / ... +http://www.baidu.com/search/spider.html)"
123.125.71.105 [11/Mar/2012:09:35:23 +0100] "GET / ... +http://www.baidu.com/search/spider.html)"
220.181.108.184 [11/Mar/2012:09:36:05 +0100] "GET / ... +http://www.baidu.com/search/spider.html)"
123.125.71.106 [11/Mar/2012:10:39:32 +0100] "GET / ... +http://www.baidu.com/search/spider.html)"
220.181.108.165 [11/Mar/2012:10:40:11 +0100] "GET / ... +http://www.baidu.com/search/spider.html)"
220.181.108.171 [11/Mar/2012:11:23:57 +0100] "GET / ... +http://www.baidu.com/search/spider.html)"

Apakah Anda menerima lalu lintas organik dari Baidu.com? Jika tidak, saya akan memblokir laba-laba jika memakan bandwidth Anda seperti itu.
Anagio

Tidak yakin tentang apa yang Anda maksud dengan lalu lintas organik, tetapi jika Anda maksudkan dari pengguna yang menggunakan mesin pencari baidu, jawabannya adalah tidak. Itu tidak mengambil banyak bandwidth atau sumber daya. Hanya saja saya ingin tahu mengapa baidu begitu banyak merangkak.
yokoloko

1
Ya itu yang saya maksud. Jika tidak memakan banyak bandwidth saya tidak akan khawatir kecuali itu dilanjutkan. Anda selalu dapat mengirim email kepada mereka. "Jika Anda menemukan akses tidak masuk akal dari Baiduspider, mohon informasikan kepada kami di spiderhelp@baidu.com"
Anagio

1
Saya hanya akan memblokir spider mesin pencari jika Anda tidak pernah ingin menerima lalu lintas pencarian dari mereka, bukan hanya karena Anda saat ini tidak menerima - terutama mengingat bahwa Baidu adalah mesin pencari terbesar ke-3 di dunia dalam hal pasar Bagikan.
Lèse majesté

3
Baidu sangat agresif sampai cukup banyak situs Anda diindeks. Ada pencakar di luar sana yang mengklaim sebagai Baidu, saya menggunakan botsvsbrowsers.com untuk mengidentifikasi mereka dan melarang mereka ketika ada yang tidak terkendali. Yandex dapat menghasilkan jenis lalu lintas yang sama juga.
Fiasco Labs

Jawaban:


7

Itu tidak terdengar seperti sesuatu yang Anda harus khawatirkan terlalu banyak, google merayapi beberapa situs saya dengan cara yang sama, tetapi itu bisa menjadi bot palsu, jadi lihat tautan di bawah ini ...

The Baidu Spider FAQ (Chrome dibangun dalam terjemahan) telah mengatakan ini: -

4. Mengapa Baiduspider merayapi situs saya terus menerus? Untuk memastikan informasi terbaru disajikan, Baiduspider menjelajah halaman baru atau halaman yang sering diperbarui di situs Anda. Periksa log untuk melihat apakah perayapan dari Baiduspider masuk akal.

Untuk menghindari perayapan berlebih oleh spammer atau pembuat masalah lain yang berpura-pura menjadi Baiduspider, Anda dapat memeriksa log. Ketika Anda menemukan perayapan yang tidak normal, beri tahu kami di spiderhelp@baidu.com dan berikan log Baiduspider.

Baidu memang menawarkan versi alat webmaster itu sendiri (fungsi terjemahan chrome akan diperlukan saat mengakses alat itu sendiri) mungkin mendaftar untuk mereka mungkin menghasilkan beberapa jawaban. Google WMT menawarkan kemampuan terbatas untuk mengelola tingkat perayapan, mungkin alat mereka menawarkan beberapa fungsi serupa.

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.