File Excel dapat dikonversi ke CSV menggunakan:
$ libreoffice --convert-to csv --headless --outdir dir file.xlsx
Semuanya tampak berfungsi dengan baik. Pengkodean, bagaimanapun, diatur ke sesuatu yang miring. Alih-alih UTF-8 mdash (-) yang saya dapatkan jika saya melakukan "save as" secara manual dari LibreOffice Calc, itu memberi saya \ 227 ( ). Menggunakan file pada CSV memberi saya "Non-ISO extended-ASCII text, dengan garis yang sangat panjang". Jadi, dua pertanyaan:
- Apa yang sebenarnya terjadi di sini?
- Bagaimana cara saya memberi tahu libreoffice untuk mengonversi ke UTF-8?
File spesifik yang saya coba konversi ada di sini .