Tesseract
Pada 2018, perangkat lunak OCR open source terbaik yang tersedia adalah Tesseract 4 (beta) dengan model OCR jaringan saraf LSTM baru . Kinerja OCR-nya jauh lebih baik daripada model OCR sebelumnya yang digunakan dalam versi 3.
Contoh (menghasilkan file PDF output.pdf
dengan lapisan teks untuk dokumen Jerman yang dipindai):
$ echo page-*.png > input.list
$ tesseract --oem 1 -l deu input.list output pdf
Cetak teks yang dikenali ke stdout:
$ tesseract --oem 1 -l deu page page-0001.png stdout
Daftar bahasa yang diinstal:
$ tesseract --list-langs
Dukungan untuk cukup banyak bahasa / skrip tersedia dalam bentuk kumpulan data terlatih yang dapat diunduh , misalnya ada set data untuk Fraktur.
Dengan model LSTM baru, Tesseract mengambil beberapa inspirasi dari proyek penelitian OCRopus .
Tesseract versi 3 berkinerja relatif buruk bahkan pada gambar input berkualitas baik, yaitu seringkali mendeteksi karakter tunggal dalam piksel debu (di luar konteks teks apa pun) dan dengan mudah memperkenalkan kesalahan karakter tunggal dengan kata-kata terkenal.
Runcing
Kinerja Cuneiform OCR tidak seburuk itu, tetapi tidak dipelihara secara aktif (rilis terakhir pada tahun 2011, versi 1.1) dan mudah macet dan memiliki beberapa masalah lain:
- Kesalahan segmentasi dengan berbagai paket dan rilis
- Algoritma tata letaknya hanya rusak, yaitu dalam dokumen satu kolom paragraf sering diacak secara acak
- itu tidak kesalahan pada opsi yang tidak dikenal
Anda dapat menonaktifkan algoritme tata letak seperti ini:
$ cuneiform --singlecolumn -l ger -f text -o foo.txt image-0001
( -l
menentukan bahasa dokumen sumber)
ocrad
$ ocrad -F utf8 image-0001
Teks dicetak secara default ke stdout.
Dalam dokumen bisnis, ia kehilangan kata yang digarisbawahi, di mana tulisan paku / tesseract / gocr tidak.
gocr
$ gocr image-0001
Teks dicetak secara default ke stdout.
Perangkat keras
Sane memiliki dukungan yang sangat baik untuk banyak pemindai umpan dokumen otomatis (ADF), misalnya untuk yang Avision dan Fujitsu .
Disertakan dengan Sane adalah scanimage
program baris perintah yang dapat Anda gunakan untuk membangun pipa pemindaian skrip (lih. Mis. adf2pdf.py
Skrip saya ).