Pertanyaan yang diberi tag «web-crawlers»

Program komputer yang mengakses halaman web untuk berbagai keperluan (untuk mengikis konten, untuk menyediakan mesin pencari dengan informasi tentang situs Anda, dll.)

2
Migrasi thread disqus. Gotchas?
Saya telah memigrasi situs ke domain baru. Situs itu sendiri cukup mudah (menggunakan Jekyll), dan semuanya telah berjalan dengan baik - kecuali migrasi utas Disqus. Saya sudah sebagian berhasil - beberapa utas telah berhasil bermigrasi, tetapi tidak semua. Saya sudah mencoba panduan migrasi domain (yang menangkap beberapa), URL mapper (yang …

2
Perayap sitemap Ask.com turun (untuk selamanya)?
Saya telah menggunakan Ask.comsebagai salah satu mesin pencari untuk melakukan ping sitemap saya. Ketika saya pergi untuk melakukan ping sitemap saya hari ini agar sitemap saya diindeks ulang, situs web ( http://submissions.ask.com/ping ) mengatakan sudah tidak ada lagi? Saya melakukan pencarian DNS submissions.ask.comdan sepertinya Ask.comtelah menghapus subdomain, tetapi FAQ Perayap …

3
Taktik untuk berurusan dengan robot yang nakal
Saya memiliki situs yang, karena alasan pengaturan, mungkin tidak diindeks atau dicari secara otomatis. Ini berarti bahwa kita harus menjauhkan semua robot dan mencegah mereka dari spidering situs. Jelas kami sudah memiliki file robots.txt yang melarangnya sejak awal. Namun, mengamati file robots.txt adalah sesuatu yang hanya dilakukan oleh robot berperilaku …



2
Tag meta "robot" mana yang mendapat preferensi?
Istri saya bekerja di sebuah sekolah menengah di Jerman. Baru-baru ini saya memperhatikan bahwa sangat sulit untuk menemukan beranda sekolah itu menggunakan Google. Saya melihat kode sumber halaman dan saya yakin saya telah menemukan alasannya: Ada dua <meta name="robots">tag; satu adalah <meta name="robots" content="all"> dan yang kedua, lebih jauh ke …

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.