Apa yang TIDAK BISA Anda temukan di Google? [Tutup]


18

Google mengaku adil, dan kepentingan perusahaan (sebagian besar waktu) untuk menjelajahi Internet untuk apa pun dan segala sesuatu yang dapat diakses oleh laba-laba. Saya ingin tahu:

  • Apa jenis konten (dapat diakses publik) yang gagal disampaikan oleh Google?
  • Apakah ada jenis konten spesifik yang tidak bisa diambil Google?

Referensi, terutama untuk dokumentasi Google sendiri, akan sangat luar biasa.


Sekarang setelah Uni Eropa memberlakukan "Hak untuk Dilupakan," ada sedikit hal yang tidak akan dapat kita temukan lagi. Inilah beberapa hal yang telah "dilupakan."
samthebrand

Jawaban:


21

Beberapa ide tentang jenis hal:

  1. Konten yang secara eksplisit dilarang oleh robots.txtfile domain dikecualikan dari indeks Google.
  2. Situs web yang tidak ditautkan dari situs web lain yang sudah diketahui Google. Artinya, mungkin ada banyak situs web yang tidak ditautkan dari halaman yang terlihat, situs web tersebut tidak akan pernah ditemukan oleh Google spider kecuali mereka dikirimkan secara manual ke Google melalui Alat Webmaster .
  3. Situs web yang berada di belakang formulir web yang harus Anda isi.
  4. Gambar sensus. Karena konten adalah gambar yang sering diindeks secara manual, mereka biasanya ditemukan di situs berbayar seperti leluhur.

Pelajari lebih lanjut tentang Deep Web


2
Poin 2 itu tidak benar. Anda dapat mengirimkan situs ke Google melalui Alat Webmaster , dan itu akan diindeks meskipun itu tidak ditautkan dari situs web lain.
Alex

Itu benar. Klarifikasi yang bagus.
amh

3
Sebenarnya saya akan tidak setuju dengan poin kedua. Saya memiliki server web uji pada PC saya dan diindeks. Saya menemukan ini dengan memeriksa log akses.
Bakudan

2
Saya telah mendaftarkan domain baru, mulai mengembangkannya dan menemukan Googlebot merayapi mereka hanya beberapa hari kemudian. Saya pikir ini agak menyeramkan sampai saya sadari - Saya mungkin bukan orang pertama yang memiliki domain ini :) Mereka tidak mengungkapkan secara spesifik, tapi saya yakin mereka melacak domain yang menurut orang cukup penting untuk didaftarkan dan pada Setidaknya beberapa dikunjungi pada suatu titik, setidaknya untuk beberapa periode waktu.
Tim Post

6

Selain Twitter, Google tidak indeks Tumblr semua yang baik. Posting blog di Tumblr lebih mudah ditemukan menggunakan pencarian Tumblr. Juga semua yang ada di Situs Google tidak (atau hampir tidak) diindeks. Jika Anda memulai situs Google, dapatkan domain Anda sendiri.

Blog yang lebih kecil yang tidak diperbarui secara teratur sering kali dibuang dari hasil pencarian. Ditambah apa pun yang mereka anggap splog .


5

Yah, sebagian besar konten Twitter tidak diindeks oleh Google, meskipun itu publik. Dulu tersedia untuk Google, tetapi itu tidak lagi terjadi sejak perjanjian mereka berakhir.

Sumber .


Sementara benar, pertanyaannya menanyakan "konten berkualitas tinggi" apa yang tidak tersedia di Google. Sebagian besar Twitter tidak akan memenuhi kriteria itu :) Saya memang melihat tweet aneh itu muncul di pencarian Google.
HappyTimeGopher

4

Itu tergantung di negara mana Anda berada. Di Jerman tidak menunjukkan ribuan situs yang menurut pemerintah tidak baik untuk Anda, dan daftarnya bertambah ribuan setiap tahun.

Google adalah motor sensor internet. Jika Anda menginginkan Internet gratis, gunakan beberapa perusahaan yang tidak jahat, seperti DuckDuckGo atau yang lainnya.




1

Situs dengan konten yang begitu banyak sehingga Google tidak punya waktu (atau kecenderungan) untuk mengindeks semuanya.

Situs yang tidak memiliki peta situs yang dapat dijelajahi dan mengharuskan Google untuk menyediakan istilah pencarian untuk mengakses hasil yang tersedia di situs mungkin tidak diindeks sepenuhnya.

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.