Halaman pengindeksan Google dengan #! meskipun kami tidak punya


11

Perusahaan kami telah mengembangkan Aplikasi Halaman Tunggal menggunakan AngularJS dan peruteannya. Google mengindeks situs kami dengan JavaScript tetapi tidak mengindeks beberapa halaman dengan baik sehingga kami telah mengembangkan versi hanya HTML.

Kami telah mengikuti Spesifikasi Perayapan Ajax yang diposting di sini dan memiliki <meta name='fragment' content='!'>tag serta url kanonik. Kami berharap http://www.example.com/foo/barakan diambil dari http://www.example.com/?_escaped_fragment_=/foo/bar.

Namun, kami telah menemukan bahwa ketika kami meluncurkan spesifikasi AJAX kami sekarang memiliki semua halaman diindeks dua kali, sekali dengan versi JavaScript sebagai http://www.example.com/foo/bardan sekali dengan versi baru sebagai http://www.example.com/#!/foo/bar. Ini berbahaya bagi kami karena itu adalah duplikat konten dan juga salah merepresentasikan situs.

Saya telah mencoba mencari pertanyaan serupa di sini dan di forum produk Google tetapi tidak dapat menemukan apa pun.


Sudahkah Anda mengangkat masalah ini dengan Google? Di forum mereka?
Jérôme Verstrynge

@JVsegera ya - Saya telah melakukan itu segera setelah saya memposting pertanyaan ini: productforums.google.com/forum/... Namun asumsi pertama saya adalah bahwa kami tidak memahami protokol dengan benar daripada ada sesuatu yang salah dengan produk mereka sehingga peluang saya untuk mendapatkan bantuan di sini cukup layak selain pertanyaan ini relevan dengan audiens target besar di sini (Semua orang dengan aplikasi halaman tunggal yang tidak menggunakan #! di URL dan ingin Google mengindeksnya). Ngomong-ngomong, sarannya.
Benjamin Gruenbaum

1
Apakah Anda mendefinisikan URL kanonik melalui rel="canonical"?
kqw

3
mengarahkan ulang #! url dan cloaking url jelek sepertinya tidak Anda ikuti spesifikasi.
Tony McCreath

1
Hanya ingin tahu, jika Anda tidak menggunakan #!URL, mengapa Anda menggunakan _escaped_fragment_dan spesifikasi Google AJAX?
MrWhite

Jawaban:


2

Jika ragu, gunakan rel="canonical". Ini bisa sesederhana menempatkan <link rel="canonical" href="http://blog.example.com/dresses/green-dresses-are-awesome" />di <head>. Lihat Google untuk info lebih lanjut.

Ini tidak akan mencegah bot merayapi kedua "versi", tetapi ini akan memberi tahu Google (dan SERP lainnya) untuk hanya mengindeks dokumen kanonik.


Dengan nada yang sama, bisakah dia menggunakan file robots.txt ??
eyoung100

Kami punya itu, mereka tidak membantu dalam kasus ini.
Benjamin Gruenbaum

1

Saya tidak begitu mengerti tentang javascript.
Dalam pengindeksan Google , kami menggunakan url kanonik <head>seperti kata @philtune. Tetapi jika Anda tidak bisa berharap http://www.example.com/foo/barakan diambil dari http://www.example.com/?_escaped_fragment_=/foo/bar.

Google Ambil baru saja mengambil canonical url.

Dalam hal ini, urlnya adalah http://www.example.com/foo/bar, google akan mengindeks http://www.example.com/foo/barjuga.

Jika Anda ingin Google mengindeks halaman Anda, tambahkan skrip ini di <head>:

<meta content = 'index, ikuti' name = 'googlebot' />

lalu ambil lagi menggunakan Google Fetch.

Note:
google akan melakukan crwal dan mengikuti dan menjelajah situs web dan mengikuti semua tautan pada halaman. Jika di halaman Anda memiliki tautan suka http://www.example.com/?_escaped_fragment_=/foo/bardan redirect ke http://www.example.com/foo/bar, google akan mengindeks http://www.example.com/foo/barkarena http://www.example.com/?_escaped_fragment_=/foo/bardiarahkan ke http://www.example.com/foo/bar.

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.