Saya memiliki file 10 Mb yang berisi \uXXXX
karakter. Bagaimana saya bisa mendekode ini dengan Teks Luhur?
Contoh:
Saya memiliki file 10 Mb yang berisi \uXXXX
karakter. Bagaimana saya bisa mendekode ini dengan Teks Luhur?
Contoh:
Jawaban:
Ada beberapa hal berbeda yang bisa Anda coba. Pertama dan terpenting, Anda harus menggunakan font Unicode yang mendukung karakter yang ingin Anda tampilkan. Situs ini di unicode.org adalah sumber yang bagus, dan Google sangat membantu, seperti biasa. Jika Anda tidak keberatan menggunakan font non-monospace, Arial Unicode MS hadir dengan Windows dan memiliki jangkauan yang cukup baik. Saya percaya font monospace yang dilakukan Consolas juga.
Kedua, sistem operasi Anda perlu diatur untuk menampilkan karakter-karakter tersebut - kebanyakan yang modern, tetapi Anda mungkin mengalami masalah dengan beberapa versi dan pengaturan Windows.
Di Sublime, pastikan Anda melihat file dalam mode yang benar - coba File -> Reopen with Encoding -> UTF-8
atau ... -> UTF-16LE
(atau BE
, Anda dapat mencoba keduanya).
Jadi, tanpa mengetahui isi persis file Anda, bagaimana itu dihasilkan, dan lebih banyak detail tentang sistem Anda, itu yang terbaik yang bisa saya lakukan. Semoga berhasil!
EDIT
Berdasarkan file yang Anda tautkan, sepertinya ini adalah output dari program Python 2, karena datanya sepertinya beberapa daftar yang berisi string unicode (saya adalah programmer Python, seperti yang terjadi). Saya mencari beberapa codepoint yang disebutkan, dan semuanya Cyrillic, jadi hampir semua font modern harus menanganinya. Masalahnya adalah bahwa Anda akan memerlukan program untuk membaca file dan menerjemahkan masing-masing byte. Jika Anda tertarik, string penuh pertama (dari '
ke '
) adalah:
Любимая акция вернулась! В ресторанах Евразия "" 3 ролла по цене 1 ""! С 9 по 12 сентября! Только эти 4 дня! Подробности на evrasia.spb.ru, 88005050145 dan 008
Tanpa memiliki seluruh file, saya tidak dapat menguraikan semuanya untuk Anda, tetapi jika Anda seorang programmer Python, Anda harus tahu apa yang harus dilakukan (saya sarankan menggunakan Python 3, dukungan Unicode-nya jauh lebih baik daripada 2.x ). Jika tidak, cari orang yang membuat file dan minta mereka untuk memecahkan kode byte untuk Anda.