Ini adalah alasan yang saya ingat diberikan karena tidak membuat UTF-8 atau representasi Unicode lainnya sebagai pengkodean karakter default untuk bahasa scripting Ruby, yang terutama dikembangkan di Jepang:
- Alasan 1: Penyatuan Han . Set karakter (tidak yakin apakah "huruf" akan benar di sini) yang digunakan Cina, Korea, dan Jepang semuanya terkait, telah berevolusi dari sejarah umum, tidak yakin tentang detailnya. Konsorsium Unicode memutuskan untuk hanya menyia-nyiakan satu titik kode Unicode untuk menyandikan semua varian (Cina, Jepang, dan Korea) dari karakter bersejarah yang sama, bahkan jika penampilan mereka berbeda dalam ketiga bahasa. Alasan mereka adalah, penampilan harus ditentukan oleh font yang digunakan untuk menampilkan teks.
Rupanya, alasan ini dianggap sebagai konyol oleh pengguna Jepang seperti halnya untuk berpendapat kepada pembaca bahasa Inggris bahwa, karena alfabet Latin telah dikembangkan dari alfabet Yunani, cukuplah hanya memiliki satu titik kode tunggal untuk alfa Yunani " α "dan Latin" a ", dan biarkan tampilan diputuskan oleh font yang digunakan. (Sama untuk "β" = "b", "γ" = "g", dll.)
(Perhatikan bahwa saya tidak akan dapat memasukkan karakter yunani di sini di stackexchange jika itu yang terjadi.)
- Alasan 2: Konversi karakter yang tidak efisien.
Mengkonversi karakter dari Unicode ke legasi Penyandian dan punggung Jepang memerlukan tabel, yaitu tidak ada perhitungan sederhana dari nilai titik kode Unicode ke nilai titik kode warisan dan sebaliknya. Juga ada beberapa kehilangan informasi ketika mengkonversi karena tidak semua titik kode dalam satu pengkodean memiliki representasi unik di pengkodean lainnya.
Mungkin ada lebih banyak alasan yang diberikan sehingga saya tidak ingat lagi.