Pertanyaan yang diberi tag «unicode»

Unicode adalah standar untuk pengkodean, representasi dan penanganan teks dengan maksud mendukung semua karakter yang diperlukan untuk teks tertulis yang menggabungkan semua sistem penulisan, simbol teknis, dan tanda baca.

5
Sangat Baik, Data pengujian contoh UTF-8 Buruk [ditutup]
Tutup. Pertanyaan ini tidak memenuhi pedoman Stack Overflow . Saat ini tidak menerima jawaban. Ingin memperbaiki pertanyaan ini? Perbarui pertanyaan agar sesuai dengan topik Stack Overflow. Tutup 3 tahun lalu . Perbaiki pertanyaan ini Jadi kami memiliki lembar contekan XSS untuk menguji pemfilteran XSS kami - tetapi selain contoh halaman …
89 unicode  utf-8 

8
Bagaimana cara mengganti karakter Unicode yang tidak dapat dicetak di Java?
Berikut ini akan menggantikan karakter kontrol ASCII (singkatan dari [\x00-\x1F\x7F]): my_string.replaceAll("\\p{Cntrl}", "?"); Berikut ini akan menggantikan semua karakter ASCII yang tidak dapat dicetak (singkatan dari [\p{Graph}\x20]), termasuk karakter beraksen: my_string.replaceAll("[^\\p{Print}]", "?"); Namun, tidak ada yang berfungsi untuk string Unicode. Adakah yang punya cara yang baik untuk menghapus karakter yang tidak …
89 java  string  unicode 


12
Apakah TCHAR masih relevan?
Saya baru mengenal pemrograman Windows dan setelah membaca buku Petzold saya bertanya-tanya: apakah masih merupakan praktik yang baik untuk menggunakan TCHARtipe dan _T()fungsi untuk mendeklarasikan string atau jika saya harus menggunakan wchar_tdan L""string dalam kode baru? Saya hanya akan menargetkan Windows 2000 dan yang lebih baru dan kode saya akan …
87 c++  c  windows  unicode  wchar-t 



6
Penggunaan 'use utf8;' memberi saya 'Karakter luas dalam cetakan'
Jika saya menjalankan program Perl berikut: perl -e 'use utf8; print "鸡\n";' Saya mendapatkan peringatan ini: Wide character in print at -e line 1. Jika saya menjalankan program Perl ini: perl -e 'print "鸡\n";' Saya tidak mendapat peringatan. Saya pikir use utf8saya harus menggunakan karakter UTF-8 dalam skrip Perl. Mengapa …
86 perl  unicode  utf-8 

2
Regex: apa itu InCombiningDiacriticalMarks?
Kode berikut sangat terkenal untuk mengubah karakter beraksen menjadi Teks biasa: Normalizer.normalize(text, Normalizer.Form.NFD).replaceAll("\\p{InCombiningDiacriticalMarks}+", ""); Saya mengganti metode "buatan tangan" saya dengan yang ini, tetapi saya perlu memahami bagian "regex" dari replaceAll 1) Apa itu "InCombiningDiacriticalMarks"? 2) Dimanakah dokumentasinya? (dan sejenisnya?) Terima kasih.
86 java  regex  unicode 

5
Set tanda baca lengkap untuk Python (bukan hanya ASCII)
Apakah ada daftar atau pustaka yang memiliki semua tanda baca yang biasa kita temui? Biasanya saya gunakan string.punctuation, tetapi beberapa karakter tanda baca tidak termasuk di dalamnya, misalnya: >>> "'" in string.punctuation True >>> "’" in string.punctuation False
40 python  string  unicode 

3
Karakter apa yang dikelompokkan dengan Array.from?
Saya telah bermain-main dengan JS dan tidak tahu bagaimana JS memutuskan elemen mana yang akan ditambahkan ke array yang dibuat saat menggunakan Array.from(). Sebagai contoh, emoji 👍 berikut memiliki nilai length2, karena terdiri dari dua titik kode, tetapi, Array.from()memperlakukan dua titik kode ini sebagai satu, memberikan array dengan satu elemen: …

2
Apakah ada cara untuk memeriksa apakah string di JS adalah satu emoji tunggal?
Pertanyaannya sederhana: Saya punya string str, bagaimana cara memeriksa apakah strada satu emoji tunggal, dan tidak ada yang lain? Selain itu saya lebih suka tidak menggunakan perpustakaan lain. Pertandingan "🍎", "⛹🏿‍♂️", "3️⃣"tapi tidak "🍓a", "𝕒","🍌🍀" Saya mengalami masalah dalam menemukan solusi tetapi berikut adalah beberapa hal yang saya coba sejauh …
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.