Saya membuat program wordcount sederhana di Java yang membaca file berbasis teks di direktori.
Namun, saya terus mendapatkan kesalahan:
java.nio.charset.MalformedInputException: Input length = 1
dari baris kode ini:
BufferedReader reader = Files.newBufferedReader(file,Charset.forName("UTF-8"));
Saya tahu saya mungkin mendapatkan ini karena saya menggunakan Charset
yang tidak menyertakan beberapa karakter dalam file teks, beberapa di antaranya menyertakan karakter bahasa lain. Tapi saya ingin memasukkan karakter itu.
Saya kemudian belajar di JavaDocs bahwa Charset
itu opsional dan hanya digunakan untuk pembacaan file yang lebih efisien, jadi saya mengubah kodenya menjadi:
BufferedReader reader = Files.newBufferedReader(file);
Tetapi beberapa file masih membuang file MalformedInputException
. Saya tidak tahu kenapa.
Saya bertanya-tanya apakah ada all-inclusive Charset
yang memungkinkan saya membaca file teks dengan berbagai jenis karakter ?
Terima kasih.
ISO-8859-1
dan itu bekerja dengan baik. Saya pikir itu untuk karakter Eropa, itu bagus. Saya masih tidak tahu mengapaUTF-16
tidak berhasil.