Pertanyaan yang diberi tag «robots.txt»

Robots.txt adalah file teks yang digunakan oleh pemilik situs web untuk memberikan instruksi tentang situs mereka ke robot web. Pada dasarnya ia memberi tahu robot bagian mana dari situs yang terbuka dan bagian mana yang ditutup. Ini disebut Protokol Pengecualian Robot.

4
File yang harus saya miliki di setiap situs web
Saya ingin memiliki daftar file yang harus ada di setiap situs web. Idenya adalah untuk menyenangkan sebagian besar browser dan bot dan turun dengan jumlah 404 pesan di log. Sejauh ini saya memiliki file-file berikut: /favicon.ico /robots.txt /sitemap.xml /apple-touch-icon-72x72-precomposed.png /apple-touch-icon-72x72.png /apple-touch-icon-precomposed.png /apple-touch-icon.png Apakah ada file lain yang sering diminta dan …




2
Bagaimana cara melarang seluruh direktori dengan robots.txt?
Saya memiliki dua situs yang saat ini saya kerjakan yaitu keranjang belanja dan pembelanja lain. Keduanya di bawah nama domain yang sama jadi misalnya http://example.com/first_url http://example.com/second_url Kedua URL ini memiliki banyak halaman di bawahnya http://example.com/first_url/product1 http://example.com/first_url/product2 http://example.com/first_url/product3 http://example.com/second_url/product1 http://example.com/second_url/product2 http://example.com/second_url/product3 Bagaimana saya melarang URL utama /first_urldan /second_urljuga semua subhalaman dan …
19 seo  robots.txt 


7
Apakah Google cache robots.txt?
Saya menambahkan file robots.txt ke salah satu situs saya seminggu yang lalu, yang seharusnya mencegah Googlebot dari mencoba mengambil URL tertentu. Namun, akhir pekan ini saya dapat melihat Googlebot memuat URL yang tepat itu. Apakah Google cache robots.txt dan, jika ya, haruskah demikian?

3
Bisakah robots.txt berada di sub-direktori server?
Saya memiliki sub-direktori yang ingin saya sembunyikan dari crawler web mesin pencari. Salah satu cara untuk melakukan ini adalah dengan menggunakan robots.txtdi direktori root server (cara standar). Namun, siapa pun yang mengetahui URL situs web dan memiliki pengetahuan web dasar dapat mengakses konten robots.txt dan dapat melihat direktori yang tidak …

4
Situs diretas, perlu menghapus semua URL yang dimulai dengan + dari Google, gunakan robots.txt?
Bisakah Anda memberi tahu saya cara memblokir URL semacam itu robots.txtagar Googlebots berhenti mengindeks? http://www.example.com/+rt6s4ayv1e/d112587/ia0g64491218q Situs web saya diretas yang sekarang dipulihkan tetapi peretas mengindeks 5.000 URL di Google dan sekarang saya mendapatkan kesalahan 404 pada tautan yang dibuat secara acak seperti di atas semuanya dimulai dengan /+tautan seperti di …

3
Apa itu file robots.txt minimum yang valid?
Saya tidak suka bahwa saya melihat banyak 404 kesalahan di access.log server web saya. Saya mendapatkan kesalahan itu karena crawler mencoba membuka file robots.txt , tetapi tidak dapat menemukannya. Jadi saya ingin menempatkan file robots.txt sederhana yang akan mencegah 404 kesalahan muncul di file log saya. Apa file minimum robots.txt …
14 robots.txt 

3
Robots.txt - CSS membolehkan atau melarang
Apakah CSS dan templat diizinkan di robots.txt ? Haruskah itu menyebabkan masalah? Di Joomla, CSS dan templat tidak diizinkan di robots.txt . Tolong bantu saya menemukan solusi untuk menolak atau tidak melarang robot untuk CSS, templat, dll. Untuk situs web saya yang akan datang.
12 css  robots.txt 




2
Alat Webmaster Google memberi tahu saya bahwa robot memblokir akses ke peta situs
Ini adalah robots.txt saya : User-agent: * Disallow: /wp-admin/ Disallow: /wp-includes/ Sitemap: http://www.example.org/sitemap.xml.gz Tetapi Alat Webmaster Google memberi tahu saya bahwa robot memblokir akses ke peta situs: Kami mengalami kesalahan saat mencoba mengakses Peta Situs Anda. Harap pastikan Peta Situs Anda mengikuti pedoman kami dan dapat diakses di lokasi yang …

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.