Pertanyaan yang diberi tag «character-encoding»

2
Bagaimana cara mendeteksi penyandian file?
Pada sistem file saya (Windows 7) saya memiliki beberapa file teks (Ini adalah file skrip SQL, jika itu penting). Ketika dibuka dengan Notepad ++ , di menu "Encoding" beberapa dari mereka dilaporkan memiliki encoding "UCS-2 Little Endian" dan beberapa "UTF-8 tanpa BOM". Apa bedanya di sini? Semua itu tampaknya merupakan …

5
Apa keuntungan memilih pengkodean ASCII dari pada UTF-8?
Semua karakter dalam ASCII dapat dikodekan menggunakan UTF-8 tanpa peningkatan penyimpanan (keduanya membutuhkan byte penyimpanan). UTF-8 memiliki manfaat tambahan dukungan karakter di luar "ASCII-karakter". Jika itu yang terjadi, mengapa akan kita pernah memilih ASCII encoding lebih UTF-8? Apakah ada use case ketika kita akan memilih ASCII bukan UTF-8?



8
Haruskah penyandian karakter selain UTF-8 (dan mungkin UTF-16 / UTF-32) dihentikan?
Kencing hewan peliharaan saya sedang melihat begitu banyak proyek perangkat lunak yang memiliki banyak kode untuk dukungan set karakter. Jangan salah paham, saya semua mendukung kompatibilitas, dan saya senang editor teks membiarkan Anda membuka dan menyimpan file dalam beberapa set karakter. Yang mengganggu saya adalah bagaimana proliferasi pengkodean karakter non-universal …

7
Apakah char carriage-return dianggap usang
Saya menulis pustaka sumber terbuka yang mem-parsing data terstruktur tetapi sengaja mengabaikan deteksi carriage-return karena saya tidak mengerti intinya. Ini menambah kompleksitas dan overhead tambahan untuk sedikit / tanpa manfaat. Yang mengejutkan saya, seorang pengguna mengirimkan bug di mana parser tidak berfungsi dan saya menemukan penyebab masalah adalah bahwa data …

5
Masalah apa yang membuat orang menggunakan pengkodean khusus Jepang dan bukan Unicode?
Di tempat kerja saya menemukan banyak file teks Jepang di Shift-JIS dan penyandian lainnya. Ini menyebabkan banyak masalah mojibake (karakter yang tidak dapat dibaca) untuk semua pengguna komputer. Unicode dimaksudkan untuk menyelesaikan masalah semacam ini dengan mendefinisikan satu set karakter untuk semua bahasa, dan serialisasi UTF-8 direkomendasikan untuk digunakan di …


2
Apakah UTF-16 memiliki lebar tetap atau lebar variabel? Mengapa UTF-8 tidak memiliki masalah byte-order?
Apakah UTF-16 memiliki lebar tetap atau lebar variabel? Saya mendapat hasil berbeda dari sumber berbeda: Dari http://www.tbray.org/ongoing/When/200x/2003/04/26/UTF : UTF-16 menyimpan karakter Unicode dalam potongan enam belas-bit. Dari http://en.wikipedia.org/wiki/UTF-16/UCS-2 : UTF-16 (16-bit Unicode Transformation Format) adalah pengkodean karakter untuk Unicode yang mampu mengkodekan angka 1.112.064 [1] (disebut titik kode) dalam ruang …

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.