Bagaimana saya menemukan ketika URL pertama kali diindeks oleh Google?


16

Bagaimana cara saya mengetahui kapan URL tertentu pertama kali diindeks oleh Google? Saya lebih suka solusi yang berfungsi bahkan untuk URL pesaing yang bukan milik saya.


1
Sangat mungkin jawabannya adalah "tidak". Google bahkan mungkin tidak menyimpan informasi ini (karena tidak ada alasan khusus mengapa mereka harus), atau, bahkan jika mereka melakukannya, mereka mungkin tidak mengungkapkannya kepada pihak ketiga.
Ilmari Karonen

1
Seperti yang telah disebutkan orang lain, Anda tidak dapat memperoleh informasi ini. Jika Anda memiliki akses ke log server, Anda bisa melihat kapan itu pertama kali dirayapi, tetapi bahkan itu tidak berarti bahwa itu diindeks saat itu.
John Mueller

Jawaban:


15

Untuk mengetahui usia URL, Anda dapat mengikuti tautan ini dengan mengganti www.example.comdengan URL yang Anda inginkan:

https://www.google.com/search?tbs=cdr%3A1%2Ccd_min%3A1%2F1%2F2000&q=site%3Ahttp%3A%2F%2Fwww.example.com&safe=active&gws_rd=ssl

Misalnya, inilah hasil dari Google untuk situs Meta dari Stack Overflow : masukkan deskripsi gambar di sini

Kalau tidak, mesin Wayback juga merupakan solusi yang baik tetapi kurang tepat dari pengalaman saya.


3
Apakah fitur Google juga tersedia dalam bahasa Inggris? Anda tertaut ke versi Perancis.
Stephen Ostermiller

1
@StephenOstermiller Cukup ubah tld dari .frmenjadi .com.
MDMoore313

2
@ Zistoloen +1 untuk jawaban Anda, tetapi saya ragu dengan pertanyaan Anda. Seperti yang Anda katakan, saya mencari www.stackexchange.com menggunakan contoh permintaan Anda tetapi tidak menunjukkan hasil apa pun. Saya mencari dengan menghapus wwwjuga saat ini menunjukkan hasil untuk tanggal Dec 1, 2014yang merupakan tanggal yang sangat baru yang tidak bisa menjadi usia URL. Apakah saya salah mencari? atau melewatkan sesuatu?
Sathiya Kumar

2
Saya "mencuri" jawaban ini dan menambahkannya ke jawaban saya dengan penjelasan yang lebih baik. Ini trik yang bagus, Zistoloen.
Stephen Ostermiller

6
@Stephen & Zistoloen: Itu umumnya bukan tanggal ketika halaman pertama kali diindeks oleh Google. Berdasarkan beberapa pengujian, tanggal yang ditunjukkan melalui metode ini tampaknya ditarik dari konten halaman (jika Google menganggap itu melihat sesuatu yang terlihat seperti tanggal "dipublikasikan pada" atau "diubah terakhir pada") atau, jika tidak ada tanggal ditemukan dalam konten, berdasarkan pada tanggal ketika Google terakhir mengamati perubahan (substansial?) ke halaman. Tentu saja, jika halaman tidak pernah berubah setelah publikasi pertamanya, ini mungkin sama dengan tanggal penerbitannya, tetapi tidak ada jaminan untuk itu.
Ilmari Karonen

8

Zistoloen menemukan cara agar Google menampilkan tanggal ketika pertama kali mengindeks konten halaman. Saya menambahkannya ke jawaban saya juga karena saya pikir saya bisa menjelaskannya dengan lebih jelas.

  1. Cari Google untuk sesuatu yang memunculkan halaman yang Anda inginkan sebagai hasilnya
  2. Gunakan "Alat Pencarian"
  3. Pilih "Rentang Kustom ..." dari tarik-turun "Kapan saja"
  4. Masukkan rentang tanggal yang besar seperti 1/1/1900 hingga 1/1/2020

Google kemudian akan menunjukkan tanggal ia menemukan konten yang ada di halaman dalam hasil pencarian.

pertama kali diindeks

Jika halaman diperbarui dengan konten baru, Google juga memperbarui tanggal ini. Jadi itu lebih dari tanggal "konten pertama diindekskan konten ini" daripada tanggal "pertama diindeks URL ini".


Cache Google untuk halaman menunjukkan kapan halaman terakhir diindeks. Anda dapat melihat bahwa halaman beranda Stack Exchange terakhir diindeks hari ini:

masukkan deskripsi gambar di sini


Pilihan lain adalah menggunakan mesin Wayback Internet Archive . Itu menunjukkan kepada Anda seperti apa halaman itu di masa lalu. Anda dapat mencari tahu kapan halaman pertama kali diterbitkan. Google dan Internet Archive merayapi dan menggunakan halaman tersebut tidak lama setelah pertama kali dipublikasikan.


1
Apakah opsi pertama Anda akan memberikan hasil yang pasti untuk semua URL? Saya mencari bing.com seperti yang Anda jelaskan tetapi tidak mendapatkan tanggal indeks pertama bing.com. Maaf kalau saya salah?
Sathiya Kumar

1
Tampaknya akurat selama konten pada halaman tersebut tidak berubah. Google dapat mengatur ulang tanggal ini jika halamannya diperbaiki. Situs saya terdaftar sebagai 1 Februari 2002 meskipun halaman internal terdaftar sebagai 1 Februari 2001. Halaman utama dirancang ulang sekitar waktu itu sedangkan halaman internal tidak berubah secara substansial sejak tahun 2001.
Stephen Ostermiller

@SathiyaKumar Bing.com memberikan tanggal 19 Maret 2014 untuk saya menggunakan metode ini. Perhatikan bahwa apa pun yang tidak diindeks oleh google (via robots.txt atau lainnya) jelas tidak akan ditampilkan melalui cara ini.
Thebluefish

4

Mungkin tidak ada cara untuk mengetahui kapan sebuah halaman web yang sewenang-wenang pertama kali diindeks oleh Google - tentu saya tidak tahu cara untuk melakukannya. Mungkin saja Google tidak menyimpan informasi itu, karena tidak ada alasan nyata mengapa mereka perlu. Selain itu, bahkan jika mereka menyimpan informasi ini, mereka benar-benar tidak memiliki alasan khusus untuk menyediakannya secara gratis kepada pihak ketiga.

(Jika itu adalah halaman Anda sendiri, dan Anda memiliki akses ke log akses server web lama Anda, mudah - cukup cari log untuk kunjungan pertama dari Googlebot ke halaman itu. Tetapi jika tidak, mungkin tidak ada cara untuk memastikannya.)


Bagaimanapun, metode yang dijelaskan oleh Zistoloen dan Stephen Ostermiller dalam jawaban mereka umumnya tidak mengungkapkan tanggal ketika URL tertentu pertama kali diindeks oleh Google. Alih-alih, ini menunjukkan tanggal yang menurut Google konten di URL diterbitkan atau terakhir diperbarui, dan sering kali didasarkan pada upaya Google yang kurang lebih andal untuk "mengendus" tanggal dari konten halaman itu sendiri.

Dalam video ini , Matt Cutts Google menyentuh secara singkat tentang bagaimana tanggal-tanggal ini dipilih. Untuk kenyamanan, saya telah menyalin bagian video yang relevan (sekitar 02:09 hingga 22:22) di bawah:

"... sering kali Anda akan melihat tanggalnya, seperti yang kami simpulkan, atau ketika kami pertama kali melihatnya, setiap kali kami merayapi laman itu, atau jika kami dapat menemukannya di suatu tempat di laman itu, dan kami dapat mengekstrak tanggal itu, Anda Saya akan melihatnya tepat di awal cuplikan. "

Untuk halaman seperti posting blog, halaman wiki atau pertanyaan Stack Exchange, di mana perangkat lunak yang menjalankan situs secara otomatis melaporkan tanggal pembuatan / modifikasi yang akurat pada halaman itu sendiri, tanggal yang dilaporkan oleh Google kemungkinan akan cocok dengan itu. Namun, untuk jenis halaman lain, sniffer tanggal Google harus bekerja lebih keras, dan itu tidak selalu membuatnya benar (apa pun artinya "benar", dalam konteks ini).

Secara khusus, tanggal-tanggal ini pada dasarnya tidak berguna untuk menentukan berapa lama halaman diindeks , karena dua alasan:

  • Jika suatu halaman telah dimodifikasi baru-baru ini, dan tanggal modifikasi ditampilkan secara jelas pada halaman tersebut, Google dapat mengambilnya sebagai "tanggal" dari halaman tersebut, walaupun modifikasi tersebut sepenuhnya sepele.

    Sebagai contoh, halaman wiki yang agak lama ini (yang diarsipkan archive.org pertama kali pada tahun 2003 ) saat ini di-datestamp oleh Google sejak tanggal 10 November 2014 - tanggal di mana halaman tersebut baru-baru ini diedit, seperti yang ditunjukkan di bagian bawah halaman. Perubahan yang terjadi pada tanggal itu? Hanya menghapus satu tautan dari bagian bawah halaman.

  • Sebaliknya, Google tampaknya senang menerima "tanggal publikasi" yang sangat lama jika menemukannya di halaman - bahkan yang sudah ada sebelum peluncuran World Wide Web .

    Misalnya, halaman ini pada kontes pemrograman lama diberi tanggal oleh Google hingga 15 September 1986 - sebenarnya tanggal acara yang dijelaskan di halaman tersebut. Demikian pula, halaman ini yang mendokumentasikan pemogokan mahasiswa pada tahun 1970 adalah tanggal oleh Google hingga 10 Mei 1970 (tanggal dari salah satu dokumen yang dipindai pada halaman), dan, yang lebih tidak masuk akal, halaman manual Linux ini ditanggal oleh Google hingga 4 November , 1989 (tanggal contoh acak digunakan pada halaman).

    Anda dapat menemukan lebih banyak contoh seperti itu dengan menggunakan pencarian rentang tanggal kustom yang dijelaskan oleh Stephen dan Zistoloen, tetapi mengatur ujung atas rentang ke, katakanlah, 6 Agustus 1991 .


Baik dalam jawaban Anda, Anda terutama menentang jawaban Stephen dan Zistoloen tetapi saya tidak menemukan jawaban yang tepat untuk pertanyaan OP "Bagaimana saya menemukan ketika URL pertama kali diindeks oleh Google?" dalam jawaban anda !!
Sathiya Kumar

Mungkin tidak akan ada jawaban, lain yang "Anda tidak bisa" atau "tidak ada yang tahu bagaimana". Tapi Anda benar, izinkan saya mengeditnya menjadi jawaban saya.
Ilmari Karonen

@llmariKaronen +1 untuk mengedit dan menambahkan jawaban untuk pertanyaan aktual OP.
Sathiya Kumar
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.