Pertanyaan yang diberi tag «unicode»

Unicode adalah standar untuk pengkodean, representasi dan penanganan teks dengan maksud mendukung semua karakter yang diperlukan untuk teks tertulis yang menggabungkan semua sistem penulisan, simbol teknis, dan tanda baca.


10
Bagaimana cara memperbaiki TypeError: Objek-Unicode harus dikodekan sebelum hashing?
Saya memiliki kesalahan ini: Traceback (most recent call last): File "python_md5_cracker.py", line 27, in <module> m.update(line) TypeError: Unicode-objects must be encoded before hashing ketika saya mencoba menjalankan kode ini dengan Python 3.2.2 : import hashlib, sys m = hashlib.md5() hash = "" hash_file = input("What is the file name in …

6
SyntaxError: Non-ASCII karakter '\ xa3' dalam file ketika fungsi mengembalikan '£'
Katakanlah saya memiliki fungsi: def NewFunction(): return '£' Saya ingin mencetak beberapa hal dengan tanda pound di depannya dan ia mencetak kesalahan ketika saya mencoba menjalankan program ini, pesan kesalahan ini ditampilkan: SyntaxError: Non-ASCII character '\xa3' in file 'blah' but no encoding declared; see http://www.python.org/peps/pep-0263.html for details Adakah yang bisa …



4
Mengapa kode ini, ditulis mundur, mencetak "Hello World!"
Berikut ini beberapa kode yang saya temukan di Internet: class M‮{public static void main(String[]a‭){System.out.print(new char[] {'H','e','l','l','o',' ','W','o','r','l','d','!'});}} Kode ini dicetak Hello World!di layar; Anda dapat melihatnya berjalan di sini . Saya bisa melihat public static void maintulisan dengan jelas , tetapi terbalik. Bagaimana cara kerja kode ini? Bagaimana ini bisa …

9
UnicodeDecodeError, byte kelanjutan tidak valid
Mengapa item di bawah ini gagal? dan mengapa itu berhasil dengan codec "latin-1"? o = "a test of \xe9 char" #I want this to remain a string as this is what I am receiving v = o.decode("utf-8") menghasilkan: Traceback (most recent call last): File "<stdin>", line 1, in <module> File …
257 python  unicode  decode 

7
Ganti karakter non-ASCII dengan satu spasi
Saya perlu mengganti semua karakter non-ASCII (\ x00- \ x7F) dengan spasi. Saya terkejut bahwa ini tidak mudah mati di Python, kecuali saya kehilangan sesuatu. Fungsi berikut hanya menghapus semua karakter non-ASCII: def remove_non_ascii_1(text): return ''.join(i for i in text if ord(i)<128) Dan yang ini menggantikan karakter non-ASCII dengan jumlah …

13
Python: Menghapus \ xa0 dari string?
Saat ini saya menggunakan Beautiful Soup untuk mem-parsing file HTML dan menelepon get_text(), tetapi sepertinya saya dibiarkan dengan banyak \ xa0 Unicode yang mewakili spasi. Apakah ada cara yang efisien untuk menghapus semuanya di Python 2.7, dan mengubahnya menjadi spasi? Saya kira pertanyaan yang lebih umum, apakah ada cara untuk …
241 python  parsing  unicode 


5
Bagaimana saya bisa mengubah penyandian file dengan vim?
Saya terbiasa menggunakan vim untuk memodifikasi akhir baris file: $ file file file: ASCII text, with CRLF line terminators $ vim file :set ff=mac :wq $ file file file: ASCII text, with CR line terminators Apakah mungkin menggunakan proses serupa untuk mengubah pengkodean unicode file? Saya mencoba yang berikut, yang …
235 vim  unicode 

8
Menulis teks Unicode ke file teks?
Saya menarik data dari Google doc, memprosesnya, dan menulisnya ke file (yang akhirnya akan saya tempelkan ke halaman Wordpress). Ini memiliki beberapa simbol non-ASCII. Bagaimana saya bisa mengonversi ini dengan aman ke simbol yang dapat digunakan dalam sumber HTML? Saat ini saya mengonversi semuanya ke Unicode di jalan, menggabungkan semuanya …

5
Apa perbedaan antara _tmain () dan main () di C ++?
Jika saya menjalankan aplikasi C ++ saya dengan metode main () berikut semuanya OK: int main(int argc, char *argv[]) { cout << "There are " << argc << " arguments:" << endl; // Loop through each argument and print its number and value for (int i=0; i<argc; i++) cout << …
224 c++  unicode  arguments 


11
JavaScript + regode Unicode
Bagaimana saya bisa menggunakan ekspresi reguler Unicode-aware dalam JavaScript? Misalnya, harus ada sesuatu yang serupa dengan \wyang dapat cocok dengan titik kode apa pun dalam kategori Letters atau Marks (bukan hanya yang ASCII), dan mudah-mudahan memiliki filter seperti [[P *]] untuk tanda baca, dll.

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.