Pertanyaan yang diberi tag «unicode»

Unicode dimaksudkan sebagai rangkaian karakter universal untuk mendeskripsikan semua karakter yang diperlukan untuk teks tertulis yang menggabungkan semua sistem penulisan, simbol teknis, dan tanda baca.

8
Apa gunanya menambahkan dukungan pengidentifikasi Unicode ke berbagai implementasi bahasa?
Saya pribadi menemukan membaca kode yang penuh dengan pengidentifikasi Unicode membingungkan. Menurut pendapat saya, ini juga mencegah agar kode tidak mudah dipelihara. Belum lagi semua upaya yang diperlukan untuk penulis dari berbagai penerjemah untuk mengimplementasikan dukungan tersebut. Saya juga terus-menerus memperhatikan kurangnya (atau keberadaan) dukungan pengidentifikasi Unicode dalam daftar (dis) …
14 unicode 

2
Implementasi Trie yang efisien untuk string unicode
Saya telah mencari implementasi String trie yang efisien. Sebagian besar saya telah menemukan kode seperti ini: Implementasi referensial di Jawa (per wikipedia) Saya tidak menyukai implementasi ini karena sebagian besar dua alasan: Mereka hanya mendukung 256 karakter ASCII. Saya perlu membahas hal-hal seperti cyrillic. Mereka sangat tidak efisien memori. Setiap …
12 unicode  trie 

5
Mengapa "charset" benar-benar berarti "encoding" dalam penggunaan umum?
Sesuatu yang telah lama membingungkan saya adalah bahwa begitu banyak perangkat lunak menggunakan istilah "charset" dan "encoding" sebagai sinonim. Ketika orang merujuk ke "encoding" unicode, mereka selalu berarti seperangkat aturan untuk mewakili karakter unicode sebagai urutan byte - seperti ASCII, atau UTF-8. Ini tampaknya masuk akal dan intuitif; idenya adalah …


1
Apakah kategori iterator C ++ melarang penulisan adaptor iterator UTF-8?
Saya telah mengerjakan adaptor iterator UTF-8. Yang saya maksud adalah adaptor yang mengubah iterator ke charatau unsigned charurutan menjadi iterator ke char32_turutan. Pekerjaan saya di sini terinspirasi oleh iterator yang saya temukan online ini . Namun, ketika saya melihat melalui standar ketika saya memulai implementasi saya sendiri, saya menyadari: tampaknya …
8 c++  c++11  unicode  utf-8 
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.