Pertanyaan yang diberi tag «utf-8»

UTF-8 adalah pengkodean karakter yang menggambarkan setiap titik kode Unicode menggunakan urutan byte satu hingga empat byte. Ini kompatibel dengan ASCII sementara tetap mendukung representasi semua poin kode Unicode.

14
Unicode (UTF-8) membaca dan menulis ke file dengan Python
Saya mengalami beberapa kegagalan otak dalam memahami membaca dan menulis teks ke file (Python 2.4). # The string, which has an a-acute in it. ss = u'Capit\xe1n' ss8 = ss.encode('utf8') repr(ss), repr(ss8) ("u'Capit \ xe1n '", "' Capit \ xc3 \ xa1n '") print ss, ss8 print >> open('f1','w'), ss8 …
330 python  unicode  utf-8  io 

24
Deteksi penyandian dan buat semuanya UTF-8
Saya membacakan banyak teks dari berbagai umpan RSS dan memasukkannya ke dalam basis data saya. Tentu saja, ada beberapa pengkodean karakter yang berbeda yang digunakan dalam umpan, misalnya UTF-8 dan ISO 8859-1. Sayangnya, terkadang ada masalah dengan penyandian teks. Contoh: "Ss" di "Fußball" akan terlihat seperti ini di basis data …

5
UTF-8: Umum? Tempat sampah? Unicode?
Saya mencoba mencari tahu susunan apa yang harus saya gunakan untuk berbagai jenis data. 100% dari konten yang akan saya simpan dikirimkan oleh pengguna. Pemahaman saya adalah bahwa saya harus menggunakan UTF-8 General CI (Case-Insensitive) daripada UTF-8 Binary. Namun, saya tidak dapat menemukan perbedaan yang jelas antara UTF-8 General CI …
279 mysql  utf-8  collation 




2
Url decode UTF-8 dengan Python
Saya telah menghabiskan banyak waktu sejauh saya pemula di Python. Bagaimana saya bisa memecahkan kode URL seperti itu: example.com?title=%D0%BF%D1%80%D0%B0%D0%B2%D0%BE%D0%B2%D0%B0%D1%8F+%D0%B7%D0%B0%D1%89%D0%B8%D1%82%D0%B0 untuk yang ini di python 2.7: example.com?title==правовая+защита url=urllib.unquote(url.encode("utf8")) adalah mengembalikan sesuatu yang sangat jelek. Masih tidak ada solusi, bantuan apa pun dihargai.

11
UTF-8 byte [] ke String
Misalkan saya baru saja menggunakan a BufferedInputStreamuntuk membaca byte dari file teks yang dikodekan UTF-8 ke dalam array byte. Saya tahu bahwa saya dapat menggunakan rutin berikut untuk mengkonversi byte ke string, tetapi apakah ada cara yang lebih efisien / lebih pintar untuk melakukan ini daripada hanya iterasi melalui byte …
243 java  utf-8 

17
“Nilai string salah” ketika mencoba memasukkan UTF-8 ke MySQL melalui JDBC?
Beginilah koneksi saya diatur: Connection conn = DriverManager.getConnection(url + dbName + "?useUnicode=true&characterEncoding=utf-8", userName, password); Dan saya mendapatkan kesalahan berikut ketika mencoba menambahkan baris ke tabel: Incorrect string value: '\xF0\x90\x8D\x83\xF0\x90...' for column 'content' at row 1 Saya menyisipkan ribuan catatan, dan saya selalu mendapatkan kesalahan ini ketika teks berisi \ xF0 …
228 mysql  jdbc  utf-8  utf8mb4 

16
Apakah saya benar-benar harus menyandikan '&' sebagai '& amp;'?
Saya menggunakan &simbol ' ' dengan HTML5 dan UTF-8 di situs saya <title>. Google menunjukkan ampersand fine pada SERPnya, seperti halnya semua browser dalam judulnya. http://validator.w3.org memberi saya ini: & tidak memulai referensi karakter. (& mungkin seharusnya lolos sebagai &.) Apakah saya benar-benar perlu melakukannya &? Saya tidak peduli tentang …

4
Tulis ke file UTF-8 dengan Python
Saya sangat bingung dengan codecs.open function. Ketika saya melakukannya: file = codecs.open("temp", "w", "utf-8") file.write(codecs.BOM_UTF8) file.close() Ini memberi saya kesalahan UnicodeDecodeError: 'ascii' codec tidak dapat mendekode byte 0xef di posisi 0: ordinal tidak dalam jangkauan (128) Jika aku melakukan: file = open("temp", "w") file.write(codecs.BOM_UTF8) file.close() Ini bekerja dengan baik. Pertanyaannya …


12
PHP DOMDokumentasi loadHTML tidak mengkodekan UTF-8 dengan benar
Saya mencoba mem-parsing beberapa HTML menggunakan DOMDocument, tetapi ketika saya melakukannya, tiba-tiba saya kehilangan penyandian saya (setidaknya begitulah yang terlihat oleh saya). $profile = "<div><p>various japanese characters</p></div>"; $dom = new DOMDocument(); $dom->loadHTML($profile); $divs = $dom->getElementsByTagName('div'); foreach ($divs as $div) { echo $dom->saveHTML($div); } Hasil dari kode ini adalah saya mendapatkan …

9
Bagaimana mengkonversi string ke utf-8 dengan Python
Saya memiliki browser yang mengirim karakter utf-8 ke server Python saya, tetapi ketika saya mengambilnya dari string kueri, pengkodean yang dikembalikan Python adalah ASCII. Bagaimana saya bisa mengkonversi string polos ke utf-8? CATATAN: String yang diteruskan dari web sudah dikodekan UTF-8, saya hanya ingin membuat Python untuk memperlakukannya sebagai UTF-8 …


Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.