Pertanyaan yang diberi tag «utf-8»

UTF-8 adalah pengkodean karakter yang menggambarkan setiap titik kode Unicode menggunakan urutan byte satu hingga empat byte. Ini kompatibel dengan ASCII sementara tetap mendukung representasi semua poin kode Unicode.

5
Apa cara yang tepat untuk menyandikan URL karakter Unicode?
Saya tahu tentang skema% uxxxx non-standar tetapi tampaknya itu bukan pilihan yang bijaksana karena skema tersebut telah ditolak oleh W3C. Beberapa contoh menarik: Karakter hati. Jika saya mengetik ini di browser saya: http://www.google.com/search?q=♥ Kemudian salin dan tempel, saya melihat URL ini http://www.google.com/search?q=%E2%99%A5 yang membuatnya tampak seperti Firefox (atau Safari) yang …

10
UnicodeDecodeError: codec 'ascii' tidak dapat mendekode byte 0xd1 di posisi 2: ordinal tidak dalam jangkauan (128)
Saya mencoba bekerja dengan kumpulan data yang sangat besar yang memiliki beberapa karakter non-standar di dalamnya. Saya perlu menggunakan unicode, sesuai spesifikasi pekerjaan, tetapi saya bingung. (Dan sangat mungkin melakukan semuanya dengan salah.) Saya membuka CSV menggunakan: 15 ncesReader = csv.reader(open('geocoded_output.csv', 'rb'), delimiter='\t', quotechar='"') Kemudian, saya mencoba untuk menyandikannya dengan: …
107 python  django  utf-8 

16
UnicodeDecodeError: codec 'ascii' tidak dapat mendekode byte 0xef di posisi 1
Saya mengalami beberapa masalah saat mencoba mengenkode string ke UTF-8. Saya sudah mencoba banyak hal, termasuk menggunakan string.encode('utf-8')dan unicode(string), tetapi saya mendapatkan kesalahan: UnicodeDecodeError: 'ascii' codec tidak dapat mendekode byte 0xef di posisi 1: ordinal tidak dalam jangkauan (128) Ini string saya: (。・ω・。)ノ Saya tidak melihat apa yang salah, ada …
106 python  unicode  utf-8 


8
C # Konversi string dari UTF-8 ke ISO-8859-1 (Latin1) H
Saya telah mencari di Google tentang topik ini dan saya telah melihat setiap jawaban, tetapi saya masih belum mengerti. Pada dasarnya saya perlu mengubah string UTF-8 menjadi ISO-8859-1 dan saya melakukannya dengan menggunakan kode berikut: Encoding iso = Encoding.GetEncoding("ISO-8859-1"); Encoding utf8 = Encoding.UTF8; string msg = iso.GetString(utf8.GetBytes(Message)); String sumber saya …
103 c#  .net  encoding  utf-8  iso-8859-1 


4
Bagaimana cara menggunakan simbol Yunani di ggplot2?
Kategori saya perlu diberi nama dengan huruf Yunani. Saya menggunakan ggplot2, dan ini bekerja dengan baik dengan data. Sayangnya saya tidak dapat menemukan cara untuk meletakkan simbol-simbol yunani tersebut pada sumbu x (pada tanda centang) dan juga membuatnya muncul di legenda. Apakah ada cara untuk melakukannya? PEMBARUAN: Saya telah melihat …
101 r  graphics  unicode  utf-8  ggplot2 

6
Menggunakan StringWriter untuk Serialisasi XML
Saya sedang mencari cara mudah untuk membuat serial objek (di C # 3). Saya mencari beberapa contoh di Google dan menemukan sesuatu seperti: MemoryStream memoryStream = new MemoryStream ( ); XmlSerializer xs = new XmlSerializer ( typeof ( MyObject) ); XmlTextWriter xmlTextWriter = new XmlTextWriter ( memoryStream, Encoding.UTF8 ); xs.Serialize …



3
Membaca InputStream sebagai UTF-8
Saya mencoba membaca dari text/plainfile melalui internet, baris demi baris. Kode yang saya miliki sekarang adalah: URL url = new URL("http://kuehldesign.net/test.txt"); BufferedReader in = new BufferedReader(new InputStreamReader(url.openStream())); LinkedList<String> lines = new LinkedList(); String readLine; while ((readLine = in.readLine()) != null) { lines.add(readLine); } for (String line : lines) { out.println("> …

5
Contoh string utf8 tidak valid?
Saya menguji bagaimana beberapa kode saya menangani data yang buruk, dan saya memerlukan beberapa seri byte yang UTF-8 tidak valid. Bisakah Anda memposting beberapa, dan idealnya, penjelasan mengapa itu buruk / di mana Anda mendapatkannya?

11
Cara elegan untuk mencari file UTF-8 dengan BOM?
Untuk tujuan debugging, saya perlu mencari direktori secara rekursif untuk semua file yang dimulai dengan UTF-8 byte order mark (BOM). Solusi saya saat ini adalah skrip shell sederhana: find -type f | while read file do if [ "`head -c 3 -- "$file"`" == $'\xef\xbb\xbf' ] then echo "found BOM …
94 php  utf-8  shell  text-editor 

9
Membaca file CSV UTF8 dengan Python
Saya mencoba membaca file CSV dengan karakter beraksen dengan Python (hanya karakter Prancis dan / atau Spanyol). Berdasarkan dokumentasi Python 2.5 untuk csvreader ( http://docs.python.org/library/csv.html ), saya menemukan kode berikut untuk membaca file CSV karena csvreader hanya mendukung ASCII. def unicode_csv_reader(unicode_csv_data, dialect=csv.excel, **kwargs): # csv.py doesn't do Unicode; encode temporarily …


Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.