Pertanyaan yang diberi tag «unicode»

Unicode adalah standar untuk pengkodean, representasi dan penanganan teks dengan maksud mendukung semua karakter yang diperlukan untuk teks tertulis yang menggabungkan semua sistem penulisan, simbol teknis, dan tanda baca.

16
UnicodeDecodeError: codec 'ascii' tidak dapat mendekode byte 0xef di posisi 1
Saya mengalami beberapa masalah saat mencoba mengenkode string ke UTF-8. Saya sudah mencoba banyak hal, termasuk menggunakan string.encode('utf-8')dan unicode(string), tetapi saya mendapatkan kesalahan: UnicodeDecodeError: 'ascii' codec tidak dapat mendekode byte 0xef di posisi 1: ordinal tidak dalam jangkauan (128) Ini string saya: (。・ω・。)ノ Saya tidak melihat apa yang salah, ada …
106 python  unicode  utf-8 


4
Bagaimana cara saya melakukan iterasi melalui titik kode unicode dari String Java?
Jadi saya tahu String#codePointAt(int), tapi itu diindeks oleh charoffset, bukan oleh titik kode offset. Saya sedang berpikir untuk mencoba sesuatu seperti: gunakan String#charAt(int)untuk mendapatkan chardi indeks menguji apakah charberada dalam kisaran pengganti tinggi jika demikian, gunakan String#codePointAt(int)untuk mendapatkan titik kode, dan naikkan indeks sebesar 2 jika tidak, gunakan nilai yang …
105 java  string  unicode 



9
Kesalahan Enkode Unicode Python
Saya membaca dan mem-parsing file Amazon XML dan ketika file XML menunjukkan ', ketika saya mencoba untuk mencetaknya saya mendapatkan kesalahan berikut: 'ascii' codec can't encode character u'\u2019' in position 16: ordinal not in range(128) Dari apa yang saya baca secara online sejauh ini, kesalahan berasal dari fakta bahwa file …
104 python  unicode  ascii  encode 

12
Panjang string dalam byte di JavaScript
Dalam kode JavaScript saya, saya perlu menulis pesan ke server dalam format ini: <size in bytes>CRLF <data>CRLF Contoh: 3 foo Data mungkin berisi karakter unicode. Saya perlu mengirimnya sebagai UTF-8. Saya mencari cara paling lintas browser untuk menghitung panjang string dalam byte di JavaScript. Saya sudah mencoba ini untuk menyusun …


8
Membaca karakter dari file dengan Python
Di file teks, ada string "Saya tidak suka ini". Namun, ketika saya membacanya menjadi string, itu menjadi "Saya tidak \ xe2 \ x80 \ x98t seperti ini". Saya memahami bahwa \ u2018 adalah representasi unicode dari "'". saya menggunakan f1 = open (file1, "r") text = f1.read() perintah untuk melakukan …



4
Jenis Python str vs unicode
Bekerja dengan Python 2.7, saya bertanya-tanya apa keuntungan nyata yang ada dalam menggunakan tipe unicodedaripada str, karena keduanya tampaknya dapat menahan string Unicode. Apakah ada alasan khusus selain mampu mengatur kode Unicode di unicodestring menggunakan char melarikan diri \?: Menjalankan modul dengan: # -*- coding: utf-8 -*- a = 'á' …
101 python  string  unicode 

4
Bagaimana cara menggunakan simbol Yunani di ggplot2?
Kategori saya perlu diberi nama dengan huruf Yunani. Saya menggunakan ggplot2, dan ini bekerja dengan baik dengan data. Sayangnya saya tidak dapat menemukan cara untuk meletakkan simbol-simbol yunani tersebut pada sumbu x (pada tanda centang) dan juga membuatnya muncul di legenda. Apakah ada cara untuk melakukannya? PEMBARUAN: Saya telah melihat …
101 r  graphics  unicode  utf-8  ggplot2 

7
Bagaimana saya bisa menghapus karakter non-ASCII tetapi meninggalkan titik dan spasi menggunakan Python?
Saya bekerja dengan file .txt. Saya ingin string teks dari file tanpa karakter non-ASCII. Namun, saya ingin meninggalkan spasi dan titik. Saat ini, saya juga menghapusnya. Berikut kodenya: def onlyascii(char): if ord(char) < 48 or ord(char) > 127: return '' else: return char def get_my_string(file_path): f=open(file_path,'r') data=f.read() f.close() filtered_data=filter(onlyascii, data) …
100 python  text  unicode  filter  ascii 

3
UnicodeDecodeError saat mengalihkan ke file
Saya menjalankan potongan ini dua kali, di terminal Ubuntu (pengkodean diatur ke utf-8), sekali dengan ./test.pydan kemudian dengan ./test.py >out.txt: uni = u"\u001A\u0BC3\u1451\U0001D10C" print uni Tanpa pengalihan mencetak sampah. Dengan pengalihan saya mendapatkan UnicodeDecodeError. Adakah yang bisa menjelaskan mengapa saya mendapatkan kesalahan hanya dalam kasus kedua, atau bahkan lebih baik …
100 python  unicode 

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.