Pertanyaan yang diberi tag «unicode»

Unicode adalah standar untuk pengkodean, representasi dan penanganan teks dengan maksud mendukung semua karakter yang diperlukan untuk teks tertulis yang menggabungkan semua sistem penulisan, simbol teknis, dan tanda baca.

6
Masalah penyandian FileReader Java
Saya mencoba menggunakan java.io.FileReader untuk membaca beberapa file teks dan mengonversinya menjadi string, tetapi saya menemukan hasilnya salah dikodekan dan tidak dapat dibaca sama sekali. Inilah lingkungan saya: Windows 2003, pengkodean OS: CP1252 Java 5.0 File saya dikodekan UTF-8 atau dikodekan CP1252, dan beberapa di antaranya (file yang dikodekan UTF-8) …
130 java  file  unicode  encoding 

12
Simbol Konversi, Huruf Aksen ke Alfabet Bahasa Inggris
Masalahnya adalah, seperti yang Anda tahu, ada ribuan karakter dalam bagan Unicode dan saya ingin mengonversi semua karakter yang mirip menjadi huruf yang menggunakan alfabet Inggris. Sebagai contoh, berikut adalah beberapa konversi: ҥ->H Ѷ->V Ȳ->Y Ǭ->O Ƈ->C tђє Ŧค๓เℓy --> the Family ... dan saya melihat bahwa ada lebih dari …

7
Tentang apakah normalisasi UTF-8?
Proyek ICU (yang juga sekarang memiliki perpustakaan PHP ) berisi kelas-kelas yang diperlukan untuk membantu menormalkan string UTF-8 untuk membuatnya lebih mudah untuk membandingkan nilai saat mencari. Namun, saya mencoba mencari tahu apa artinya ini untuk aplikasi. Misalnya, dalam kasus apa saya ingin "Canonical Equivalence" daripada "Compatibilityivalence", atau sebaliknya?


8
Apa kode karakter HTML 8203?
Apa kode karakter (HTML) ​? Saya menemukannya di salah satu skrip jQuery saya dan bertanya-tanya apa itu .. Terima kasih. Edit: Ini skrip yang ada di dalamnya (ditambahkan di bagian akhir, ditemukan di Firebug) <script src="http://code.jquery.com/jquery-latest.js" type="text/javascript"></script> <script type="text/javascript"> var $jnyh = jQuery.noConflict(); $jnyh(function() { $jnyh("#title-nyh").click(function() { $jnyh(".show-hide-nyh").slideDown("slow"); }, function() …

3
Unicode setara untuk \ w dan \ b dalam ekspresi reguler Java?
Banyak penerapan ekspresi reguler modern menafsirkan \wsingkatan kelas karakter sebagai "huruf, angka, atau tanda baca apa pun" (biasanya: garis bawah). Dengan cara itu, regex seperti \w+pertandingan kata seperti hello, élève, GOÄ_432atau gefräßig. Sayangnya, Java tidak. Di Jawa, \wdibatasi hingga [A-Za-z0-9_]. Ini membuat kata-kata yang cocok seperti yang disebutkan di atas …

10
Bagaimana cara mencegah karakter Unicode dirender sebagai emoji di HTML dari JavaScript?
Saya menemukan Unicode untuk karakter khusus dari pencarian FileFormat.Info . Beberapa karakter ditampilkan sebagai mesin terbang hitam-putih klasik, seperti ⚠ (tanda peringatan, \u26A0atau ⚠). Ini lebih disukai, karena saya bisa menerapkan gaya CSS (seperti warna) padanya. Yang lain dirender sebagai emoji kartun yang lebih baru, seperti ⌛ (jam pasir, \u231Batau …
119 javascript  html  css  unicode  emoji 

7
Python - codec 'ascii' tidak dapat mendekode byte
Saya sangat bingung. Saya mencoba menyandikan tetapi kesalahannya mengatakan can't decode.... >>> "你好".encode("utf8") Traceback (most recent call last): File "<stdin>", line 1, in <module> UnicodeDecodeError: 'ascii' codec can't decode byte 0xe4 in position 0: ordinal not in range(128) Saya tahu bagaimana menghindari kesalahan dengan awalan "u" pada string. Saya hanya …


13
Membuat karakter Unicode dari nomornya
Saya ingin menampilkan karakter Unicode di Java. Jika saya melakukan ini, itu berfungsi dengan baik: String symbol = "\u2202"; simbol sama dengan "∂". Itu yang saya mau. Masalahnya adalah saya mengetahui nomor Unicode dan perlu membuat simbol Unicode darinya. Saya mencoba (kepada saya) hal yang jelas: int c = 2202; …

6
Bagaimana cara mengeluarkan UTF-8 dari Perl?
Saya mencoba menulis skrip Perl menggunakan pragma "utf8", dan saya mendapatkan hasil yang tidak diharapkan. Saya menggunakan Mac OS X 10.5 (Leopard), dan saya mengedit dengan TextMate. Semua pengaturan saya untuk editor dan sistem operasi saya secara default menulis file dalam format utf-8. Namun, ketika saya memasukkan yang berikut ini …
110 perl  unicode  utf-8 

3
Bagaimana cara kerja "pengkodean lebar-variabel" UTF-8?
Standar unicode memiliki cukup poin kode di dalamnya sehingga Anda memerlukan 4 byte untuk menyimpan semuanya. Itulah yang dilakukan pengkodean UTF-32. Namun pengkodean UTF-8 entah bagaimana meremasnya ke dalam ruang yang jauh lebih kecil dengan menggunakan sesuatu yang disebut "pengkodean lebar-variabel". Faktanya, ini berhasil mewakili 127 karakter pertama US-ASCII hanya …


5
Apa cara yang tepat untuk menyandikan URL karakter Unicode?
Saya tahu tentang skema% uxxxx non-standar tetapi tampaknya itu bukan pilihan yang bijaksana karena skema tersebut telah ditolak oleh W3C. Beberapa contoh menarik: Karakter hati. Jika saya mengetik ini di browser saya: http://www.google.com/search?q=♥ Kemudian salin dan tempel, saya melihat URL ini http://www.google.com/search?q=%E2%99%A5 yang membuatnya tampak seperti Firefox (atau Safari) yang …


Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.