Saya memiliki Linux Mint 17.2 x32 Cinnamon. Mungkin langkah-langkah ini akan berhasil di Ubuntu 14,04 x32 juga.
- Instal Tesseract OCR sudo apt-get install -y tesseract-ocr tesseract-ocr-eng Anda dapat menambahkan bahasa lain dengan menginstal paket tambahan. Tangkapan layar ini dari sinaptik:
Paket bahasa Tesseract di Sinaptik
Menggunakan Tesseract
OPSI 1 - dengan membuka terminal commandline, kemudian pergi ke folder tempat Anda menyimpan file gambar (jpg, png) dan jalankan perintah:
a) untuk mengkonversi semua file gambar ke teks
for i in *png; do b=`basename "$i" .png`; tesseract -l eng "$i" "$b" text; done
Untuk menggabungkan semua file teks menjadi satu, jalankan perintah cat *.txt >> all.txt
b) untuk mengonversi semua file gambar ke file hocr (buka dengan Firefox)
for i in *png; do b=`basename "$i" .png`; tesseract -l eng "$i" "$b" hocr; done
OPSI 2 - oleh GUI
a) Instal gImageReader, dan gunakan
sudo add-apt-repository -y ppa:sandromani/gimagereader
sudo apt-get update
sudo apt-get install -y gimagereader
b) Aplikasi kedua adalah VietOCR. Versi aktual adalah 4.0, jadi unduh VietOCR-4.0.zip
Buka paket file dan buka VietOCR.jar oleh Java:
Buka VietOCR oleh Java
Jika Anda tidak menginstal Java, maka Anda dapat menginstalnya dari repositori atau Anda dapat menginstal Oracle Java 8. Langkah-langkah untuk menginstal Oracle Java 8 di Ubuntu 14.04
sudo add-apt-repository ppa:webupd8team/java
sudo apt-get update
sudo apt-get install oracle-java8-installer
sudo apt-get install oracle-java8-set-default
Saya merekomendasikan VietOCR, karena memungkinkan Anda untuk file pdf OCR, konversi massal juga merupakan pilihan.