Apakah ada indikator yang jelas bahwa file sitemap saya bermanfaat?


73

Baru-baru ini saya membuat file sitemap.xml dan mengunggahnya ke akun Google Webmasters Tools saya . Google tidak melaporkan masalah atau kesalahan apa pun dengan sitemap situs saya yang diunggah.

Sekarang pertanyaan saya adalah:

  • Bagaimana saya tahu jika sitemap saya berfungsi di dalam Alat Webmaster Google?

Alasan saya bertanya adalah saya tidak tahu apa yang seharusnya saya lihat atau cari, dan rasanya saya sudah mengunggah file yang tidak berguna.

Jawaban:


93

Sebuah file peta situs membantu mesin pencari untuk menemukan URL baru dan diperbarui pada website Anda. Secara khusus, jika situs web Anda cukup besar, maka ini dapat membantu mereka untuk dapat fokus pada konten yang baru & diperbarui, alih-alih harus membabi buta menjelajahi segala sesuatu untuk melihat apakah ada yang berubah. Itu dapat mengakibatkan konten baru ditemukan jauh lebih cepat, yang bisa sangat terlihat terutama jika situs lebih besar atau lebih kompleks.

Khususnya dengan Google (saya bekerja di Google; saya tidak tahu bagaimana mesin pencari lain menangani ini), ia juga melakukan hal berikut:

  • Temukan jumlah URL yang diindeks untuk situs web Anda: Statistik ini dihitung ulang setiap hari dan sangat akurat. Anda dapat menemukannya di halaman detail Peta Situs .
  • Temukan masalah kanonikisasi: Jika angka-angka di sana tidak cocok , itu sering merupakan tanda bahwa Anda menentukan URL dalam file Peta Situs yang tidak cocok dengan yang kami temukan selama perayapan kami. Itu biasanya merupakan tanda bahwa Anda perlu mengerjakan kanonikisasi .
  • Bantuan dengan kanonikisasi: Ketika kami menemukan beberapa URL di situs Anda yang menunjukkan konten yang identik, kami akan memberikan URL apa pun yang tercantum dalam Peta Situs keunggulan tambahan, bahkan jika Anda tidak menggunakan metode kanonikisasi lainnya.
  • Temukan bagian-bagian situs Anda yang tidak diindeks dengan buruk: Jumlah ini disediakan per file Peta Situs, sehingga Anda dapat membuat file peta situs terpisah untuk bagian logis dari situs Anda, untuk menemukan area di mana Google tidak mengindeks sebanyak yang Anda inginkan.
  • Prioritaskan kesalahan perayapan: Di bagian kesalahan perayapan , URL yang ditentukan dalam file peta situs dicantumkan secara terpisah. Karena Anda secara khusus menyediakan URL-URL ini, kami menganggap bahwa Anda ingin mereka diindeks, dan bahwa setiap kesalahan perayapan ada yang penting.

Selain itu, Anda dapat menggunakan beberapa ekstensi dalam file Peta Situs (mis. Untuk gambar, video, Berita, atau internasionalisasi), jika Anda memilih untuk melakukannya. Semua ekstensi ini bersifat opsional.

Untuk sebagian besar situs web, elemen file Peta Situs yang paling terlihat adalah Anda dapat melihat jumlah URL yang diindeks. Diperlukan waktu satu hari untuk muncul, jadi jika Anda baru saja mengirim Peta Situs untuk pertama kalinya, Anda mungkin perlu sedikit bersabar. Sementara cara lain (misalnya situs: -query) adalah perkiraan yang sangat, sangat kasar, jumlah ini sangat akurat.

Diedit untuk menambahkan: hal lain yang menurut saya sangat berguna untuk Sitemaps adalah jika Anda tidak membuatnya secara langsung dengan CMS, Anda selalu menemukan banyak hal tentang bagaimana situs web Anda dapat dijelajahi, dan jenis URL apa yang ditemukan selama proses itu. Saya telah melihat banyak kasus di mana merayapi situs web dengan alat di sisi Anda (mis. Generator Peta Situs) akan menggembungkan masalah yang mungkin Anda lewatkan, baik itu ID sesi di URL, duplikat konten melalui perbedaan URL, ruang tak terbatas (seperti sebagai kalender tanpa akhir), atau bahkan bagian dari situs yang tidak ditautkan sama sekali.


Info bagus Saya juga telah mendengar bahwa dengan beberapa lalu lintas tinggi situs-situs yang dirayapi lebih baik tidak menggunakan sitemap karena Google melakukan perayapan pekerjaan yang lebih baik dan jika ada sesuatu yang hilang dari sitemap Anda mungkin akan berhenti diindeks.
Chris_O

3
@ Chris_O Anda sedang memecahkan masalah yang berbeda bersama-sama. Dalam contoh itu, bukan berarti Google melakukan perayapan pekerjaan yang "lebih baik"; peta situs itu sendiri salah. Itu bukan argumen langsung untuk "tidak menggunakan peta situs sama sekali." Solusi untuk situasi itu adalah memperbaiki peta situs. Selain itu, peta situs bersifat informatif, bukan arahan. Sesuatu yang hilang dari sitemap tidak berarti Google tidak akan menemukannya sendiri, atau mengabaikannya.
Su '30

Situs tersebut memiliki lebih dari 40 ribu halaman yang diindeks dan konten baru diindeks dalam waktu kurang dari 5 menit (tanpa peta situs). Berdasarkan jawaban Anda, kami akan mulai membangunnya dan memecahnya menjadi bertahun-tahun.
Chris_O

@ john-mueller hai mr. m. - saya pernah mengirimkan sitemap pengujian dengan 1000 URL, kami mendapatkan kembali jumlah indeks sekitar 700, sekarang kami menguji semua 1000 URL melalui situs: www.complete.org/url/to/the/page.html, kami kembali cara menghitung di bawah 700 url (lebih di 200 wilayah). Apa artinya ini?
Franz

2
@ Franz Kadang-kadang ada detail yang terlibat yang menyulitkan untuk mereproduksi jumlah URL yang diindeks dengan situs: -kueri. Misalnya, ada beberapa situasi di mana kami dapat menggabungkan beberapa URL dan hanya menampilkan salah satunya untuk sebuah situs: -query. Jadi jika Anda melihat perbedaan di sana, biasanya tidak perlu dikhawatirkan.
John Mueller

6

Jika Anda tidak mendapatkan kesalahan maka Anda dapat menganggap Google telah menguraikannya dan mengetahui isinya. Tetapi itu tidak berarti mereka akan merayapi dan / atau mengindeks halaman-halaman itu. Peta Situs hanyalah cara lain untuk memberi tahu mesin pencari tentang halaman Anda. Mereka tidak wajib menjelajah dan mengindeks sebagian atau semua halaman itu. Hal yang sama berlaku untuk mereka menemukan halaman melalui tautan atau pengiriman URL.


1
Sebagai informasi tambahan, cukup mudah untuk melihat apakah Google memahami peta situs. Periksa di bawah Pengoptimalan -> Peta Situs. Ini akan memberi tahu Anda berapa banyak URL yang telah dikirimkan di sitemap. Sitemap berhasil membaca konten dan menemukan banyak tautan di dalamnya. Angka kedua adalah berapa banyak yang telah diindeks dan seperti yang ditunjukkan oleh John, sepenuhnya tergantung pada Google, apakah mereka menemukan tidak ada, sebagian, atau sebagian besar konten Anda bermanfaat. Itu akan selalu kurang dari jumlah yang dikirimkan, Google hanya menemukan beberapa halaman menjadi tidak terlalu panas dan tidak peduli dengan mereka.
Fiasco Labs

1

Google biasanya melakukan pekerjaan merayapi situs web Anda dengan baik jika Anda memiliki sejumlah tautan berkualitas. Jika Anda menghabiskan banyak waktu melihat jumlah halaman yang telah Anda indeks, saya sarankan lebih baik untuk meningkatkan situs Anda dan mendapatkan beberapa tautan berkualitas.


0

Mungkin alat validasi sitemap seperti ini , meskipun saya belum pernah "tidak" melihat sitemap mulai menendang.


File sudah divalidasi. Bukan itu pertanyaannya.
Su '27

0

Untuk situs web yang lebih besar, misalnya situs web dengan ratusan, ribuan atau jutaan halaman, ini cukup berguna. Kami memiliki di situs perusahaan kami dengan 400.000 halaman tempat URL dibuat secara dinamis oleh ID konten dan parameter URL digunakan dengan &, Alat Webmaster Google akan memberi Anda umpan balik pada halaman yang dirayapi dan menunjukkan kesalahan, Anda dapat men-debug atau membuka halaman dan lihat sendiri apa yang salah. Dengan cara ini Google sebenarnya membantu kami membuat situs web yang lebih baik dan menyelamatkan kami dari rasa malu yang besar beberapa kali.

Juga bermanfaat untuk melihat jumlah halaman yang diindeks vs. jumlah yang dirayapi.

Untuk situs web yang lebih kecil, jika situs web adalah sekelompok kecil halaman .html di mana setiap halaman ditautkan melalui menu dan situs tidak sering diperbarui, jika Anda mengunggah sitemap, tidak ada yang akan berubah terhadap hasil pencarian. Anda tidak akan mendapat keuntungan memiliki sitemap diunggah ke seseorang yang tidak mengunggah sitemap.

Saya juga dulu memiliki sekitar 20 situs web kecil, di mana saya memiliki sitemaps yang dihasilkan oleh skrip cron secara otomatis dan saya berhenti melakukannya. Suatu hari saya menemukan bahwa file XML tidak dihasilkan dengan benar selama sekitar 6 bulan karena kesalahan saya, tetapi Google untungnya mengabaikan kesalahan saya dan mengindeks situs web ini sepenuhnya bahkan ketika peta situs memiliki kesalahan, Google menggunakan peta situs hanya sebagai petunjuk ke mana harus pergi, tidak sangat serius.

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.