Apakah ada cara untuk menentukan charset yang digunakan untuk shapefile yang diberikan?
Apakah ada cara untuk menentukan charset yang digunakan untuk shapefile yang diberikan?
Jawaban:
Trial and error. Cobalah untuk membuka file .dbf dengan Ms Excel atau dengan OpenOffice menggunakan pengaturan yang berbeda sampai Anda mendapatkan semuanya dengan benar.
Lihatlah tulisan ini untuk petunjuk lebih lanjut: /programming/319095/how-do-i-determine-the-character-set-of-a-string
Ada dua cara bagi program untuk menentukan set karakter untuk suatu shapefile.
The fileutilitas mampu menebak pengkodean dari file teks. Gunakan ogr2ogruntuk konversi yang mempertahankan penyandian asli jika tidak ada .cpgfile :
ogr2ogr -f CSV file.csv file.dbf
file file.csv
Contoh output:
file.csv: ISO-8859 text
Saya telah mengujinya dengan dua pengkodean yang paling sering, UTF-8 dan latin1. Berfungsi di luar kotak di Ubuntu, tidak yakin tentang OS X. Saya tidak mengetahui adanya fileutilitas pada Windows.
CATATAN : Segera setelah ada .cpgfile yang sesuai yang menunjukkan pengkodean, ogr2ograkan menghormatinya dan hasilnya akan berada di UTF-8. Tetapi jika output CSV terlihat benar, Anda tahu bahwa informasi dalam .cpgfile tersebut akurat.
Tabel lain untuk mengkonversi byte ke-29 dari * .dbf ke halaman kode: http://webhelp.esri.com/arcpad/8.0/referenceguide/index.htm#locales/task_code.htm