Ringkasan
Jika server Anda menyajikan halaman dengan pengikat (seperti halnya smartypants), mesin pencari tidak konsisten. Bing saat ini tidak mengindeks ligatur dengan benar. Saya akan mengatakan secara umum, itu meminta masalah. Karena mesin pencari berubah, ada metode di bawah ini yang dapat Anda gunakan untuk menguji bagaimana mesin pencari Anda tertarik pada pengikat indeks .
Jika server Anda mengeluarkan halaman dengan teks biasa, maka Javascript mengubahnya menjadi ligatur, itu bagus . Mesin pencari tidak menerapkan perubahan konten Javascript sebelum mengindeks halaman (meskipun diklaim bahwa ada beberapa pengecualian seperti memuat komentar Facebook ). Karena ada metode standar industri untuk memberikan konten dinamis mesin pencari dan metode ini didukung oleh Google , itu akan menjadi kejutan besar jika ini berubah di masa depan. Google menyarankan untuk meramban situs Anda menggunakan peramban teks biasa (mis. Mereka menyarankan Lynx ) untuk melihat konten Anda bagaimana mesin pencari melihatnya.
Detail lebih lanjut tentang kasus pertama (halaman disajikan dengan ligatur dalam kode) ...
Dalam teori
... seharusnya tidak ada bedanya dengan mesin pencari yang diatur dengan baik.
Pertama membantu untuk memahami perbedaan antara mesin terbang dan karakter . Ligatur fi
adalah satu mesin terbang yang mewakili dua karakter f
i
. Bagaimana perangkat lunak memperlakukannya hingga perangkat lunak itu dan tergantung pada konteks dan tugas yang ada - Anda akan melihat dari contoh dalam pertanyaan terkait bahwa ketika Anda menyalin dan menempelkan mesin terbang, apa yang disisipkan akan bervariasi: kadang-kadang mesin terbang ditempelkan, kadang-kadang mesin terbang diperlakukan sebagai karakter yang terkait dan f
dan i
ditempelkan.
Setiap pemroses teks otomatis yang dibuat dengan baik dan tertarik pada semantik teks (mesin pencari, pemeriksa ejaan, pembaca layar ...) harus memperlakukan mesin terbang identik dengan karakter yang diperlihatkannya, dan harus memperlakukannya finally
identik finally
, karena itulah yang tekstual arti fi
mesin terbang.
Dalam praktek
Tidak semuanya dibuat dengan baik ...
Inilah cara mudah untuk menguji mesin pencari. Inilah sederetan teks dari pertanyaan lain itu:
Copy the ligature fi from Illustrator to this input box
Jika kita mengambil versi non-ligatures dari kalimat itu dan mencarinya dalam tanda kutip ganda:
(mencari di "Copy the ligature fi from Illustrator to this input box"
):
- ... jika mesin pencari memperlakukan mesin terbang pengikat sebagai cocok untuk karakter yang mereka wakili, itu akan menemukan halaman itu (dan, ketika itu diindeks, yang ini)
- ... jika mesin pencari memperlakukan mesin terbang berbeda dengan karakter yang diwakilinya, itu tidak akan menemukan apa-apa sampai halaman ini diindeks, kemudian, itu hanya akan menemukan halaman ini, dan pencarian dengan versi ligatur akan menemukan halaman itu.
- ... jika mesin pencari panik melihat mesin terbang seperti ligatur sepenuhnya, itu tidak akan menemukan apa-apa, bahkan halaman ini, dan pencarian dengan versi ligatur juga tidak akan menemukan apa-apa
Beberapa hasil cepat untuk 5 mesin pencari teratas dunia (tautan menuju hasil pencarian):
- Google: Bagus (tipe 1) . (Meskipun ada komentar di bawah, ini cocok dengan format unicode atau HTML)
- Bing: Gagal ( tipe 2 ).
- Yahoo: Gagal ( tipe 2 ) (ternyata Yahoo "Didukung oleh Bing")
- Yandex (Rusia): Bagus (tipe 1)
- Baidu (Cina): erm, tidak ada halaman graphicdesign.stackexchange.com tampaknya muncul dalam pencarian Baidu sama sekali ... mungkin kita dilarang di sana ...?!