Pada tahun 2010, apakah Anda akan menyajikan URL yang berisi karakter UTF-8 di portal web besar?
Karakter unicode dilarang sesuai RFC di URL (lihat di sini ). Mereka harus persen dikodekan agar sesuai dengan standar.
Poin utama saya, bagaimanapun, adalah melayani karakter yang tidak dikodekan hanya untuk tujuan memiliki URL yang terlihat bagus, jadi encoding persen keluar.
Semua browser utama tampaknya mengurai URL tersebut dengan baik, apa pun yang dikatakan RFC. Kesan umum saya, bagaimanapun, adalah bahwa hal itu menjadi sangat goyah ketika meninggalkan domain browser web:
- URL mendapatkan copy + paste ke file teks, E-Mail, bahkan situs Web dengan pengkodean yang berbeda
- Perpustakaan Klien HTTP
- Browser eksotis, pembaca RSS
Apakah kesan saya benar bahwa masalah diharapkan terjadi di sini, dan karena itu (belum) solusi praktis jika Anda melayani audiens non-teknis dan penting agar semua link Anda berfungsi dengan baik meskipun dikutip dan diteruskan?
Apakah ada cara ajaib untuk menyajikan URL yang terlihat bagus dalam HTML
http://www.example.com/düsseldorf?neighbourhood=Lörick
yang dapat disalin + ditempel dengan karakter khusus yang utuh, tetapi berfungsi dengan benar saat digunakan kembali di klien lama?