Pertanyaan yang diberi tag «character-encoding»

Pengkodean karakter mengacu pada cara karakter direpresentasikan sebagai serangkaian byte. Pengkodean karakter untuk Web didefinisikan dalam Standar Pengkodean.

6
Apakah kode ASCII 7-bit atau 8-bit?
Guru saya memberi tahu saya bahwa ASCII adalah skema pengkodean karakter 8-bit. Tetapi itu didefinisikan hanya untuk kode 0-127 yang berarti dapat dimasukkan ke dalam 7-bit. Jadi tidak bisakah dikatakan bahwa bit ASCII sebenarnya adalah kode 7-bit? Dan apa yang ingin kami katakan ketika mengatakan ASCII adalah kode 8-bit?

7
Cara andal menebak encoding antara MacRoman, CP1252, Latin1, UTF-8, dan ASCII
Di tempat kerja sepertinya tidak ada minggu yang berlalu tanpa beberapa konipsi terkait pengkodean, bencana, atau malapetaka. Masalahnya biasanya berasal dari programmer yang mengira mereka dapat memproses file "teks" dengan andal tanpa menentukan encodingnya. Tapi Anda tidak bisa. Jadi diputuskan untuk sejak saat itu melarang file memiliki nama yang berakhiran …

3
JsonParseException: Karakter tidak dikutip ilegal ((CTRL-CHAR, kode 10)
Saya mencoba menggunakan org.apache.httpcomponentsuntuk menggunakan Rest API, yang akan memposting data format JSON ke API. Saya mendapatkan pengecualian ini: Disebabkan oleh: com.fasterxml.jackson.core.JsonParseException: Illegal unquoted character ((CTRL-CHAR, code 10)): harus di-escape menggunakan garis miring terbalik untuk dimasukkan dalam string. Alasannya karena ctrl-chartermasuk dalam string JSON. Apakah ada cara untuk mengganti ini …

10
Semua Charset inklusif untuk menghindari "java.nio.charset.MalformedInputException: Input length = 1"?
Saya membuat program wordcount sederhana di Java yang membaca file berbasis teks di direktori. Namun, saya terus mendapatkan kesalahan: java.nio.charset.MalformedInputException: Input length = 1 dari baris kode ini: BufferedReader reader = Files.newBufferedReader(file,Charset.forName("UTF-8")); Saya tahu saya mungkin mendapatkan ini karena saya menggunakan Charsetyang tidak menyertakan beberapa karakter dalam file teks, beberapa …



2
Berapa bit atau byte yang ada dalam sebuah karakter? [Tutup]
Sulit untuk mengatakan apa yang ditanyakan di sini. Pertanyaan ini ambigu, kabur, tidak lengkap, terlalu luas, atau retoris dan tidak dapat dijawab secara wajar dalam bentuknya saat ini. Untuk bantuan dalam mengklarifikasi pertanyaan ini sehingga dapat dibuka kembali, kunjungi pusat bantuan . Tutup 9 tahun yang lalu . Berapa banyak …

9
Membaca file CSV UTF8 dengan Python
Saya mencoba membaca file CSV dengan karakter beraksen dengan Python (hanya karakter Prancis dan / atau Spanyol). Berdasarkan dokumentasi Python 2.5 untuk csvreader ( http://docs.python.org/library/csv.html ), saya menemukan kode berikut untuk membaca file CSV karena csvreader hanya mendukung ASCII. def unicode_csv_reader(unicode_csv_data, dialect=csv.excel, **kwargs): # csv.py doesn't do Unicode; encode temporarily …

6
Bagaimana Cara Menemukan Charset / Encoding Default di Java?
Jawaban yang jelas adalah dengan menggunakan Charset.defaultCharset()tetapi kami baru-baru ini menemukan bahwa ini mungkin bukan jawaban yang tepat. Saya diberitahu bahwa hasilnya berbeda dari charset default nyata yang digunakan oleh kelas java.io dalam beberapa kesempatan. Sepertinya Java menyimpan 2 set rangkaian karakter default. Apakah ada yang punya wawasan tentang masalah …


5
Python: Mengonversi dari ISO-8859-1 / latin1 ke UTF-8
Saya memiliki string ini yang telah diterjemahkan dari Quoted-printable ke ISO-8859-1 dengan modul email. Ini memberi saya string seperti "\ xC4pple" yang akan sesuai dengan "Äpple" (Apple dalam bahasa Swedia). Namun, saya tidak dapat mengonversi string tersebut ke UTF-8. >>> apple = "\xC4pple" >>> apple '\xc4pple' >>> apple.encode("UTF-8") Traceback (most …

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.