Saya tidak bekerja untuk Google, dan tidak bisa mengatakan dengan pasti apa yang sebenarnya mereka lakukan, tetapi cara yang masuk akal bagi mereka untuk menangani <lastmod>
cap waktu adalah sebagai petunjuk untuk tidak membuang waktu merayapi kembali halaman yang belum berubah.
Jadi, jika Anda melaporkan semua halaman Anda sebagai diubah setiap hari, Googlebot akan terus merayapi semua halaman Anda dalam urutan apa pun rasanya, daripada hanya berfokus pada halaman yang telah berubah. Akibatnya, seolah-olah Anda tidak melaporkan stempel waktu modifikasi terakhir sama sekali.
Alasan utama untuk memberikan <lastmod>
stempel waktu yang benar adalah untuk membuat perubahan pada situs Anda muncul lebih cepat dalam indeks Google. Jika Anda memiliki ratusan halaman di situs Anda, perlu beberapa saat bagi Google untuk merayapi semuanya dan menemukan perubahan apa pun. Namun, jika Anda memberi tahu Googlebot halaman mana yang telah berubah baru-baru ini, Googlebot dapat merayapi halaman-halaman itu terlebih dahulu dan menghindari membuang begitu banyak waktu untuk sisanya.
Tentu saja, Anda hanya dapat meningkatkan laju perayapan Googlebot di Alat Webmaster dan berharap yang terbaik. Tapi sungguh, seharusnya tidak terlalu sulit untuk membuat skrip pembaruan Anda menjaga cap waktu. Misalnya, saya menganggap Anda sedang melakukan sesuatu seperti ini:
for each product do:
write new page content into product page file;
end do;
Jika demikian, ubah saja ke sesuatu seperti ini sebagai gantinya:
for each product do:
read old page content from product page file into string A;
write new page content into string B;
if A is not equal to B then:
write string B into product page file;
end if;
end do;