Saya sedang mengerjakan situs web yang akan menawarkan konten yang dilokalkan mengikuti language+region
pendekatan seperti yang dijelaskan pada halaman W3.org ini (misalnya fr-CA
untuk konten Perancis Kanada, dan fr-FR
untuk konten "Prancis Prancis"). Karena kami menganggap konten untuk masing-masing language+region
sebagai unik, sangat penting bagi kami bahwa mesin pencari mengidentifikasi dan melayani konten dengan tepat.
Dengan mencari di Internet (mis. Pertanyaan ini ), tampaknya kebanyakan orang merekomendasikan penggunaan kode bahasa ISO639 dalam lang
atribut HTML untuk menggambarkan bahasa konten. Mengikuti rekomendasi ini, kami akan menggunakan <html lang="fr">
yang tidak memungkinkan diferensiasi antara language+region
kombinasi yang disebutkan di atas .
Saat meninjau spesifikasi HTML4 , tampaknya menggunakan language+region
kode bahasa sama sekali OK, karena en-US
contoh diberikan sebagai salah satu nilai yang mungkin. Namun saya tidak dapat menemukan konfirmasi mengenai hal ini dalam spesifikasi HTML5 yang sepertinya tidak memberikan contoh mengenai nilai yang diizinkan.
Dari sana saya mencoba untuk mendapatkan jawaban de facto dengan melihat apa yang dilakukan raksasa web. Saya melihat apa yang dilakukan Facebook: mereka menawarkan versi Candian French dan French French dari situs web mereka dengan (sedikit) konten yang berbeda, sementara nilai HTML lang
tetap sama:
fr-CA
URL: http://fr-ca.facebook.com
Atribut lang HTML: <html lang="fr">
terjemahan dari kata 'email':courriel
fr-FR
URL: http://fr-fr.facebook.com/
Atribut HTML lang: <html lang="fr">
terjemahan dari kata 'email':Adresse électronique
Apa cara yang direkomendasikan / standar untuk menggambarkan konten yang dilokalkan menggunakan language+region
pendekatan dalam HTML5?