Saya membuat program wordcount sederhana di Java yang membaca file berbasis teks di direktori.
Namun, saya terus mendapatkan kesalahan:
java.nio.charset.MalformedInputException: Input length = 1
dari baris kode ini:
BufferedReader reader = Files.newBufferedReader(file,Charset.forName("UTF-8"));
Saya tahu saya mungkin mendapatkan ini karena saya menggunakan Charsetyang tidak menyertakan beberapa karakter dalam file teks, beberapa di antaranya menyertakan karakter bahasa lain. Tapi saya ingin memasukkan karakter itu.
Saya kemudian belajar di JavaDocs bahwa Charsetitu opsional dan hanya digunakan untuk pembacaan file yang lebih efisien, jadi saya mengubah kodenya menjadi:
BufferedReader reader = Files.newBufferedReader(file);
Tetapi beberapa file masih membuang file MalformedInputException. Saya tidak tahu kenapa.
Saya bertanya-tanya apakah ada all-inclusive Charsetyang memungkinkan saya membaca file teks dengan berbagai jenis karakter ?
Terima kasih.
ISO-8859-1dan itu bekerja dengan baik. Saya pikir itu untuk karakter Eropa, itu bagus. Saya masih tidak tahu mengapaUTF-16tidak berhasil.