Pertanyaan yang diberi tag «utf-8»

1
Apakah penggunaan "utf8 = ✓" lebih baik daripada "utf8 = true"?
Saya baru-baru ini melihat beberapa URI yang berisi parameter kueri "utf8 = ✓". Kesan pertama saya (setelah berpikir "mmm, terlihat keren") adalah ini dapat digunakan untuk mendeteksi pengkodean karakter yang rusak. Jadi, apakah ini cara yang lebih baik untuk menyelesaikan masalah potensial dengan pengkodean karakter, atau hanya pengembang yang bersenang-senang …

2
Bagaimana cara mendeteksi penyandian file?
Pada sistem file saya (Windows 7) saya memiliki beberapa file teks (Ini adalah file skrip SQL, jika itu penting). Ketika dibuka dengan Notepad ++ , di menu "Encoding" beberapa dari mereka dilaporkan memiliki encoding "UCS-2 Little Endian" dan beberapa "UTF-8 tanpa BOM". Apa bedanya di sini? Semua itu tampaknya merupakan …

5
Apa keuntungan memilih pengkodean ASCII dari pada UTF-8?
Semua karakter dalam ASCII dapat dikodekan menggunakan UTF-8 tanpa peningkatan penyimpanan (keduanya membutuhkan byte penyimpanan). UTF-8 memiliki manfaat tambahan dukungan karakter di luar "ASCII-karakter". Jika itu yang terjadi, mengapa akan kita pernah memilih ASCII encoding lebih UTF-8? Apakah ada use case ketika kita akan memilih ASCII bukan UTF-8?



8
Haruskah penyandian karakter selain UTF-8 (dan mungkin UTF-16 / UTF-32) dihentikan?
Kencing hewan peliharaan saya sedang melihat begitu banyak proyek perangkat lunak yang memiliki banyak kode untuk dukungan set karakter. Jangan salah paham, saya semua mendukung kompatibilitas, dan saya senang editor teks membiarkan Anda membuka dan menyimpan file dalam beberapa set karakter. Yang mengganggu saya adalah bagaimana proliferasi pengkodean karakter non-universal …


2
Apakah UTF-16 memiliki lebar tetap atau lebar variabel? Mengapa UTF-8 tidak memiliki masalah byte-order?
Apakah UTF-16 memiliki lebar tetap atau lebar variabel? Saya mendapat hasil berbeda dari sumber berbeda: Dari http://www.tbray.org/ongoing/When/200x/2003/04/26/UTF : UTF-16 menyimpan karakter Unicode dalam potongan enam belas-bit. Dari http://en.wikipedia.org/wiki/UTF-16/UCS-2 : UTF-16 (16-bit Unicode Transformation Format) adalah pengkodean karakter untuk Unicode yang mampu mengkodekan angka 1.112.064 [1] (disebut titik kode) dalam ruang …


1
Apakah kategori iterator C ++ melarang penulisan adaptor iterator UTF-8?
Saya telah mengerjakan adaptor iterator UTF-8. Yang saya maksud adalah adaptor yang mengubah iterator ke charatau unsigned charurutan menjadi iterator ke char32_turutan. Pekerjaan saya di sini terinspirasi oleh iterator yang saya temukan online ini . Namun, ketika saya melihat melalui standar ketika saya memulai implementasi saya sendiri, saya menyadari: tampaknya …
8 c++  c++11  unicode  utf-8 
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.