Saya sedang mengerjakan situs web yang akan menawarkan konten yang dilokalkan mengikuti language+regionpendekatan seperti yang dijelaskan pada halaman W3.org ini (misalnya fr-CAuntuk konten Perancis Kanada, dan fr-FRuntuk konten "Prancis Prancis"). Karena kami menganggap konten untuk masing-masing language+regionsebagai unik, sangat penting bagi kami bahwa mesin pencari mengidentifikasi dan melayani konten dengan tepat.
Dengan mencari di Internet (mis. Pertanyaan ini ), tampaknya kebanyakan orang merekomendasikan penggunaan kode bahasa ISO639 dalam langatribut HTML untuk menggambarkan bahasa konten. Mengikuti rekomendasi ini, kami akan menggunakan <html lang="fr">yang tidak memungkinkan diferensiasi antara language+regionkombinasi yang disebutkan di atas .
Saat meninjau spesifikasi HTML4 , tampaknya menggunakan language+regionkode bahasa sama sekali OK, karena en-UScontoh diberikan sebagai salah satu nilai yang mungkin. Namun saya tidak dapat menemukan konfirmasi mengenai hal ini dalam spesifikasi HTML5 yang sepertinya tidak memberikan contoh mengenai nilai yang diizinkan.
Dari sana saya mencoba untuk mendapatkan jawaban de facto dengan melihat apa yang dilakukan raksasa web. Saya melihat apa yang dilakukan Facebook: mereka menawarkan versi Candian French dan French French dari situs web mereka dengan (sedikit) konten yang berbeda, sementara nilai HTML langtetap sama:
fr-CA
URL: http://fr-ca.facebook.com
Atribut lang HTML: <html lang="fr">
terjemahan dari kata 'email':courriel
fr-FR
URL: http://fr-fr.facebook.com/
Atribut HTML lang: <html lang="fr">
terjemahan dari kata 'email':Adresse électronique
Apa cara yang direkomendasikan / standar untuk menggambarkan konten yang dilokalkan menggunakan language+regionpendekatan dalam HTML5?