Pertanyaan yang diberi tag «unicode»

Unicode dimaksudkan sebagai rangkaian karakter universal untuk mendeskripsikan semua karakter yang diperlukan untuk teks tertulis yang menggabungkan semua sistem penulisan, simbol teknis, dan tanda baca.

20
Haruskah UTF-16 dianggap berbahaya?
Saya akan bertanya apa yang mungkin merupakan pertanyaan yang cukup kontroversial: "Haruskah salah satu pengkodean paling populer, UTF-16, dianggap berbahaya?" Mengapa saya menanyakan pertanyaan ini? Berapa banyak programmer yang menyadari fakta bahwa UTF-16 sebenarnya adalah penyandian panjang variabel? Maksud saya, ada poin kode yang, diwakili sebagai pasangan pengganti, mengambil lebih …
432 unicode 


15
Apakah buruk menggunakan karakter Unicode dalam nama variabel? [Tutup]
Saya baru-baru ini mencoba menerapkan algoritma peringkat, AllegSkill, ke Python 3. Seperti apa matematika itu: Tidak benar-benar. Inilah yang saya tulis: t = (µw-µl)/c # those are used in e = ε/c # multiple places. σw_new = (σw**2 * (1 - (σw**2)/(c**2)*Wwin(t, e)) + γ**2)**.5 Saya benar-benar berpikir itu disayangkan …
82 naming  unicode 

8
Mengapa ada beberapa pengkodean Unicode?
Saya pikir Unicode dirancang untuk mengatasi seluruh masalah memiliki banyak pengkodean yang berbeda karena ruang alamat kecil (8 bit) di sebagian besar upaya sebelumnya (ASCII, dll.). Lalu mengapa ada begitu banyak pengkodean Unicode? Bahkan beberapa versi dari yang (pada dasarnya) sama, seperti UTF-8, UTF-16, dll.


2
Lisensi Unicode
Ketentuan Penggunaan Unicode menyatakan bahwa perangkat lunak apa pun yang menggunakan file data mereka (atau modifikasi dari mereka) harus membawa referensi lisensi Unicode. Menurut saya, sebagian besar pustaka Unicode memiliki fungsi untuk memeriksa apakah sebuah karakter adalah digit, huruf, simbol, dll., Dan karenanya akan berisi modifikasi File Data Unicode (biasanya …


8
Haruskah penyandian karakter selain UTF-8 (dan mungkin UTF-16 / UTF-32) dihentikan?
Kencing hewan peliharaan saya sedang melihat begitu banyak proyek perangkat lunak yang memiliki banyak kode untuk dukungan set karakter. Jangan salah paham, saya semua mendukung kompatibilitas, dan saya senang editor teks membiarkan Anda membuka dan menyimpan file dalam beberapa set karakter. Yang mengganggu saya adalah bagaimana proliferasi pengkodean karakter non-universal …


5
Masalah apa yang membuat orang menggunakan pengkodean khusus Jepang dan bukan Unicode?
Di tempat kerja saya menemukan banyak file teks Jepang di Shift-JIS dan penyandian lainnya. Ini menyebabkan banyak masalah mojibake (karakter yang tidak dapat dibaca) untuk semua pengguna komputer. Unicode dimaksudkan untuk menyelesaikan masalah semacam ini dengan mendefinisikan satu set karakter untuk semua bahasa, dan serialisasi UTF-8 direkomendasikan untuk digunakan di …



3
Apakah mungkin untuk menulis fungsi reverse string umum yang berfungsi untuk semua lokalisasi dan tipe string?
Saya hanya menonton presentasi Jon Skeet (dengan Tony the Pony) dari Dev-Days. Meskipun "menulis fungsi string terbalik" adalah coding wawancara 101 - Saya tidak yakin itu benar-benar mungkin untuk menulis fungsi string terbalik umum, tentu saja bukan yang bekerja di semua lokalisasi dan semua jenis string. Selain mendeteksi jika string …

2
Apakah UTF-16 memiliki lebar tetap atau lebar variabel? Mengapa UTF-8 tidak memiliki masalah byte-order?
Apakah UTF-16 memiliki lebar tetap atau lebar variabel? Saya mendapat hasil berbeda dari sumber berbeda: Dari http://www.tbray.org/ongoing/When/200x/2003/04/26/UTF : UTF-16 menyimpan karakter Unicode dalam potongan enam belas-bit. Dari http://en.wikipedia.org/wiki/UTF-16/UCS-2 : UTF-16 (16-bit Unicode Transformation Format) adalah pengkodean karakter untuk Unicode yang mampu mengkodekan angka 1.112.064 [1] (disebut titik kode) dalam ruang …

3
Nilai sentinel Unicode yang dapat saya gunakan?
Saya mendesain format file dan saya ingin melakukannya dengan benar. Karena ini adalah format biner, byte pertama (atau byte) dari file tidak boleh membentuk karakter tekstual yang valid (seperti pada header file PNG 1 ). Ini memungkinkan alat yang tidak mengenali format untuk tetap melihat bahwa itu bukan file teks …
14 unicode 

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.