Pertanyaan yang diberi tag «unicode»

Unicode adalah standar untuk pengkodean, representasi dan penanganan teks dengan maksud mendukung semua karakter yang diperlukan untuk teks tertulis yang menggabungkan semua sistem penulisan, simbol teknis, dan tanda baca.

17
Cara terbaik untuk mengonversi file teks antar set karakter?
Apa alat atau metode tercepat, termudah untuk mengonversi file teks antara set karakter? Secara khusus, saya perlu mengkonversi dari UTF-8 ke ISO-8859-15 dan sebaliknya. Semuanya berjalan: satu-baris dalam bahasa skrip favorit Anda, alat baris perintah atau utilitas lain untuk OS, situs web, dll. Solusi terbaik sejauh ini: Di Linux / …




12
UTF-8, UTF-16, dan UTF-32
Apa perbedaan antara UTF-8, UTF-16, dan UTF-32? Saya mengerti bahwa mereka semua akan menyimpan Unicode, dan masing-masing menggunakan jumlah byte yang berbeda untuk mewakili karakter. Apakah ada keuntungan memilih satu dari yang lain?
487 unicode  utf-8  utf-16  utf  utf-32 

12
Menyimpan teks utf-8 di json.dumps sebagai UTF8, bukan sebagai \ u escape sequence
Kode sampel: >>> import json >>> json_string = json.dumps("ברי צקלה") >>> print json_string "\u05d1\u05e8\u05d9 \u05e6\u05e7\u05dc\u05d4" Masalahnya: itu tidak dapat dibaca manusia. Pengguna (cerdas) saya ingin memverifikasi atau bahkan mengedit file teks dengan dump JSON (dan saya lebih suka tidak menggunakan XML). Apakah ada cara untuk membuat objek bersambung menjadi string …
474 python  json  unicode  utf-8  escaping 

30
Cara terbaik untuk membalik string
Saya baru saja menulis fungsi string reverse di C # 2.0 (yaitu LINQ tidak tersedia) dan muncul dengan ini: public string Reverse(string text) { char[] cArray = text.ToCharArray(); string reverse = String.Empty; for (int i = cArray.Length - 1; i > -1; i--) { reverse += cArray[i]; } return reverse; …

18
UnicodeDecodeError saat membaca file CSV di Pandas dengan Python
Saya menjalankan program yang sedang memproses 30.000 file serupa. Sejumlah acak dari mereka berhenti dan menghasilkan kesalahan ini ... File "C:\Importer\src\dfman\importer.py", line 26, in import_chr data = pd.read_csv(filepath, names=fields) File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 400, in parser_f return _read(filepath_or_buffer, kwds) File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 205, in _read return parser.read() File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 608, …


9
Apa itu Unicode, UTF-8, UTF-16?
Apa dasar untuk Unicode dan mengapa kebutuhan untuk UTF-8 atau UTF-16? Saya telah meneliti ini di Google dan mencari di sini juga tetapi tidak jelas bagi saya. Dalam VSS ketika melakukan perbandingan file, kadang-kadang ada pesan yang mengatakan bahwa kedua file memiliki UTF yang berbeda. Mengapa demikian? Tolong jelaskan secara …

5
Mengapa 2+ 40 sama dengan 42?
Saya bingung ketika seorang kolega menunjukkan saya jajaran JavaScript yang memperingatkan 42 ini. alert(2+ 40); Jalankan cuplikan kodeSembunyikan hasilLuaskan cuplikan Dengan cepat ternyata apa yang tampak seperti tanda minus sebenarnya adalah karakter Unicode yang misterius dengan semantik yang berbeda. Ini membuat saya bertanya-tanya mengapa karakter itu tidak menghasilkan kesalahan sintaksis …

11
Bagaimana cara saya menerima semua karakter non-ASCII?
Saya memiliki beberapa file XML yang sangat besar dan saya mencoba menemukan garis yang berisi karakter non-ASCII. Saya sudah mencoba yang berikut ini: grep -e "[\x{00FF}-\x{FFFF}]" file.xml Tapi ini mengembalikan setiap baris dalam file, terlepas dari apakah baris tersebut mengandung karakter dalam rentang yang ditentukan. Apakah saya salah sintaks atau …
359 regex  unix  unicode  grep 


6
Cara menemukan panjang string di R
Bagaimana menemukan panjang string (jumlah karakter dalam string) tanpa membaginya dalam R? Saya tahu cara menemukan panjang daftar tetapi bukan string. Dan bagaimana dengan string Unicode? Bagaimana cara menemukan panjang (dalam byte) dan jumlah karakter (rune, simbol) dalam string Unicode? Pertanyaan terkait: Cara menemukan jumlah karakter "asli" dalam string Unicode …

14
Unicode (UTF-8) membaca dan menulis ke file dengan Python
Saya mengalami beberapa kegagalan otak dalam memahami membaca dan menulis teks ke file (Python 2.4). # The string, which has an a-acute in it. ss = u'Capit\xe1n' ss8 = ss.encode('utf8') repr(ss), repr(ss8) ("u'Capit \ xe1n '", "' Capit \ xc3 \ xa1n '") print ss, ss8 print >> open('f1','w'), ss8 …
330 python  unicode  utf-8  io 

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.