Bagaimana cara saya mengetahui kapan URL tertentu pertama kali diindeks oleh Google? Saya lebih suka solusi yang berfungsi bahkan untuk URL pesaing yang bukan milik saya.
Bagaimana cara saya mengetahui kapan URL tertentu pertama kali diindeks oleh Google? Saya lebih suka solusi yang berfungsi bahkan untuk URL pesaing yang bukan milik saya.
Jawaban:
Untuk mengetahui usia URL, Anda dapat mengikuti tautan ini dengan mengganti www.example.com
dengan URL yang Anda inginkan:
https://www.google.com/search?tbs=cdr%3A1%2Ccd_min%3A1%2F1%2F2000&q=site%3Ahttp%3A%2F%2Fwww.example.com&safe=active&gws_rd=ssl
Misalnya, inilah hasil dari Google untuk situs Meta dari Stack Overflow :
Kalau tidak, mesin Wayback juga merupakan solusi yang baik tetapi kurang tepat dari pengalaman saya.
.fr
menjadi .com
.
www
juga saat ini menunjukkan hasil untuk tanggal Dec 1, 2014
yang merupakan tanggal yang sangat baru yang tidak bisa menjadi usia URL. Apakah saya salah mencari? atau melewatkan sesuatu?
Zistoloen menemukan cara agar Google menampilkan tanggal ketika pertama kali mengindeks konten halaman. Saya menambahkannya ke jawaban saya juga karena saya pikir saya bisa menjelaskannya dengan lebih jelas.
Google kemudian akan menunjukkan tanggal ia menemukan konten yang ada di halaman dalam hasil pencarian.
Jika halaman diperbarui dengan konten baru, Google juga memperbarui tanggal ini. Jadi itu lebih dari tanggal "konten pertama diindekskan konten ini" daripada tanggal "pertama diindeks URL ini".
Cache Google untuk halaman menunjukkan kapan halaman terakhir diindeks. Anda dapat melihat bahwa halaman beranda Stack Exchange terakhir diindeks hari ini:
Pilihan lain adalah menggunakan mesin Wayback Internet Archive . Itu menunjukkan kepada Anda seperti apa halaman itu di masa lalu. Anda dapat mencari tahu kapan halaman pertama kali diterbitkan. Google dan Internet Archive merayapi dan menggunakan halaman tersebut tidak lama setelah pertama kali dipublikasikan.
bing.com
. Maaf kalau saya salah?
Mungkin tidak ada cara untuk mengetahui kapan sebuah halaman web yang sewenang-wenang pertama kali diindeks oleh Google - tentu saya tidak tahu cara untuk melakukannya. Mungkin saja Google tidak menyimpan informasi itu, karena tidak ada alasan nyata mengapa mereka perlu. Selain itu, bahkan jika mereka menyimpan informasi ini, mereka benar-benar tidak memiliki alasan khusus untuk menyediakannya secara gratis kepada pihak ketiga.
(Jika itu adalah halaman Anda sendiri, dan Anda memiliki akses ke log akses server web lama Anda, mudah - cukup cari log untuk kunjungan pertama dari Googlebot ke halaman itu. Tetapi jika tidak, mungkin tidak ada cara untuk memastikannya.)
Bagaimanapun, metode yang dijelaskan oleh Zistoloen dan Stephen Ostermiller dalam jawaban mereka umumnya tidak mengungkapkan tanggal ketika URL tertentu pertama kali diindeks oleh Google. Alih-alih, ini menunjukkan tanggal yang menurut Google konten di URL diterbitkan atau terakhir diperbarui, dan sering kali didasarkan pada upaya Google yang kurang lebih andal untuk "mengendus" tanggal dari konten halaman itu sendiri.
Dalam video ini , Matt Cutts Google menyentuh secara singkat tentang bagaimana tanggal-tanggal ini dipilih. Untuk kenyamanan, saya telah menyalin bagian video yang relevan (sekitar 02:09 hingga 22:22) di bawah:
"... sering kali Anda akan melihat tanggalnya, seperti yang kami simpulkan, atau ketika kami pertama kali melihatnya, setiap kali kami merayapi laman itu, atau jika kami dapat menemukannya di suatu tempat di laman itu, dan kami dapat mengekstrak tanggal itu, Anda Saya akan melihatnya tepat di awal cuplikan. "
Untuk halaman seperti posting blog, halaman wiki atau pertanyaan Stack Exchange, di mana perangkat lunak yang menjalankan situs secara otomatis melaporkan tanggal pembuatan / modifikasi yang akurat pada halaman itu sendiri, tanggal yang dilaporkan oleh Google kemungkinan akan cocok dengan itu. Namun, untuk jenis halaman lain, sniffer tanggal Google harus bekerja lebih keras, dan itu tidak selalu membuatnya benar (apa pun artinya "benar", dalam konteks ini).
Secara khusus, tanggal-tanggal ini pada dasarnya tidak berguna untuk menentukan berapa lama halaman diindeks , karena dua alasan:
Jika suatu halaman telah dimodifikasi baru-baru ini, dan tanggal modifikasi ditampilkan secara jelas pada halaman tersebut, Google dapat mengambilnya sebagai "tanggal" dari halaman tersebut, walaupun modifikasi tersebut sepenuhnya sepele.
Sebagai contoh, halaman wiki yang agak lama ini (yang diarsipkan archive.org pertama kali pada tahun 2003 ) saat ini di-datestamp oleh Google sejak tanggal 10 November 2014 - tanggal di mana halaman tersebut baru-baru ini diedit, seperti yang ditunjukkan di bagian bawah halaman. Perubahan yang terjadi pada tanggal itu? Hanya menghapus satu tautan dari bagian bawah halaman.
Sebaliknya, Google tampaknya senang menerima "tanggal publikasi" yang sangat lama jika menemukannya di halaman - bahkan yang sudah ada sebelum peluncuran World Wide Web .
Misalnya, halaman ini pada kontes pemrograman lama diberi tanggal oleh Google hingga 15 September 1986 - sebenarnya tanggal acara yang dijelaskan di halaman tersebut. Demikian pula, halaman ini yang mendokumentasikan pemogokan mahasiswa pada tahun 1970 adalah tanggal oleh Google hingga 10 Mei 1970 (tanggal dari salah satu dokumen yang dipindai pada halaman), dan, yang lebih tidak masuk akal, halaman manual Linux ini ditanggal oleh Google hingga 4 November , 1989 (tanggal contoh acak digunakan pada halaman).
Anda dapat menemukan lebih banyak contoh seperti itu dengan menggunakan pencarian rentang tanggal kustom yang dijelaskan oleh Stephen dan Zistoloen, tetapi mengatur ujung atas rentang ke, katakanlah, 6 Agustus 1991 .