Saya sangat meragukan bahwa tanggal posting atau artikel yang dipublikasikan didasarkan pada <lastmod>
entri dalam sitemap XML (seperti yang disarankan orang lain) atau header HTTP yang Terakhir Dimodifikasi dalam hal ini. Peta Situs XML hanya berupa penasehat, bukan otoritatif. Tanggal modifikasi dokumen yang terakhir mungkin tidak sama dengan tanggal penerbitan (asli) dari sebuah artikel. Dan, seperti yang saya sebutkan dalam komentar saya di bagian atas halaman, tanggal modifikasi terakhir dari suatu dokumen mungkin lebih penting untuk caching dan mungkin menentukan tingkat perayapan. Header HTTP Yang Terakhir Dimodifikasi dari laman yang dibuat secara dinamis seringkali sangat dekat dengan tanggal / waktu aktual (seperti untuk blog WordPress).
Umpan RSS / Atom di sisi lain memang mengandung nugget informasi khusus ini. Dan memang, di situs Wordpress yang tidak memasukkan tanggal publikasi dalam konten, tanggal publikasi masih muncul di hasil pencarian Google. Dan sejauh yang saya tahu, ini cocok dengan tanggal di RSS Feed.
EDIT # 1: Namun, umpan RSS tidak harus berisi semua halaman. Dalam sebagian besar kasus, ini seharusnya hanya berisi halaman terbaru atau yang terbaru diperbarui. Tetapi tidak ada alasan bahwa Google harus melupakan apa yang sudah dibaca, dan menyediakan konten halaman itu tidak berubah maka tanggal modifikasi terakhir juga tidak boleh.
Jika tidak ada umpan RSS, saya pikir Google cukup pintar untuk menganalisis konten halaman. Terutama jika kurma ditandai 'semantik' dengan bantuan mikroformats . Sangat layak bahwa Google akan melihat yang berikut sebagai tanggal yang resmi untuk artikel yang terkandung di dalamnya:
<abbr class="published" title="2010-08-27T15:45:00-0700">
Friday, August 27th, 2010
</abbr>
Google tentu tidak membaca Microformats - hCard, hReview, dll
Hanya untuk menambahkan, saya tidak berpikir Google akan menyatakan tanggal publikasi kecuali ia dapat menemukan sesuatu yang otoritatif yang akan menyarankan ini. Itu tidak akan menyimpulkan 'tanggal publikasi' pada data spekulatif, karena 'tanggal publikasi' yang salah tidak berguna bagi siapa pun dan Google akan mendapatkan banyak manfaat untuk itu!
Dan hanya untuk catatan (jika @Tom menyarankan sebaliknya :) Saya pikir posting / artikel harus memiliki tanggal publikasi yang terlihat jelas. Banyak yang tidak, dan ini bisa membuat frustasi bagi pembaca terutama ketika meneliti masalah teknologi dan Anda menemukan bahwa setelah membaca setengah dari artikel itu sudah ketinggalan zaman!
EDIT # 2: Sejak itu saya mengalami gangguan yang sama yang @mmdanziger jelaskan dalam jawabannya. Di salah satu situs lama saya, saya memiliki teks dari bentuk "Situs Terakhir Diperbarui Minggu, 17 Juni 2012" (tidak ditandai dengan cara khusus) di bagian atas setiap halaman (ditulis ke halaman dengan JavaScript !!). Ini sama tanggal telah dijemput oleh Google dan sekarang muncul bersama beberapa halaman (tetapi tidak semua) yang muncul di SERPs - ini pasti bukan tanggal mempublikasikan halaman. Tampaknya Google hanya menggesek halaman untuk string bentuk "terakhir diperbarui ( datestring )" (setelah memproses JavaScript !!). Situs khusus ini tidak memiliki umpan RSS. Situs ini memang memiliki file Sitemap.xml tetapi tanggalnya berbeda.
Saya perhatikan perilaku serupa di situs lain juga.