Jawaban:
Sungguh, cara jitu untuk menguji adalah dengan mengunduh file teks dan memasukkannya ke terminal dan melihat apakah semuanya terlihat baik-baik saja.
atau, jika Anda bisa, kompilasi ulang terminal yang mengaktifkan opsi unicode (dengan asumsi ada satu).
seperti apa bentuk $ TERM dan $ LANG?
Ketikkan ini di terminal Anda:
echo -e '\xe2\x82\xac'
Jika terminal Anda mendukung UTF-8, itu akan menampilkan tanda euro:
€
Cara paling lama: jalankan mengikuti dan periksa output. Ini akan menjadi modal O dengan sirkumfleks jika terminal menampilkan UTF-8.
perl -le 'print "\x{c3}\x{94}"'
perl -CO -le 'print "\x{d4}"'
Cara api yang paling pasti adalah dengan menggunakan perintah 'lokal'. Ini akan mencetak semua variabel beragam dan beragam yang menentukan karakter apa yang akan digunakan. Sebagai contoh, ini adalah output saya di RHEL5.3, diatur untuk hanya menggunakan UTF-8 secara default.
LANG="en_US.UTF-8"
LC_COLLATE="en_US.UTF-8"
LC_CTYPE="en_US.UTF-8"
LC_MESSAGES="en_US.UTF-8"
LC_MONETARY="en_US.UTF-8"
LC_NUMERIC="en_US.UTF-8"
LC_TIME="en_US.UTF-8"
LC_ALL=
curl http://www.cl.cam.ac.uk/~mgk25/ucs/examples/UTF-8-demo.txt
atau
wget -O - http://www.cl.cam.ac.uk/~mgk25/ucs/examples/UTF-8-demo.txt
Ini jelas membutuhkan wget
atau curl
.