Apakah ada cara untuk menentukan charset yang digunakan untuk shapefile yang diberikan?
Apakah ada cara untuk menentukan charset yang digunakan untuk shapefile yang diberikan?
Jawaban:
Trial and error. Cobalah untuk membuka file .dbf dengan Ms Excel atau dengan OpenOffice menggunakan pengaturan yang berbeda sampai Anda mendapatkan semuanya dengan benar.
Lihatlah tulisan ini untuk petunjuk lebih lanjut: /programming/319095/how-do-i-determine-the-character-set-of-a-string
Ada dua cara bagi program untuk menentukan set karakter untuk suatu shapefile.
The file
utilitas mampu menebak pengkodean dari file teks. Gunakan ogr2ogr
untuk konversi yang mempertahankan penyandian asli jika tidak ada .cpg
file :
ogr2ogr -f CSV file.csv file.dbf
file file.csv
Contoh output:
file.csv: ISO-8859 text
Saya telah mengujinya dengan dua pengkodean yang paling sering, UTF-8 dan latin1. Berfungsi di luar kotak di Ubuntu, tidak yakin tentang OS X. Saya tidak mengetahui adanya file
utilitas pada Windows.
CATATAN : Segera setelah ada .cpg
file yang sesuai yang menunjukkan pengkodean, ogr2ogr
akan menghormatinya dan hasilnya akan berada di UTF-8. Tetapi jika output CSV terlihat benar, Anda tahu bahwa informasi dalam .cpg
file tersebut akurat.
Tabel lain untuk mengkonversi byte ke-29 dari * .dbf ke halaman kode: http://webhelp.esri.com/arcpad/8.0/referenceguide/index.htm#locales/task_code.htm