2
Memfilter gambar yang agak “setengah kencang” untuk pemrosesan OCR
Saya memiliki bahan PDF yang dipindai yang ingin saya tambahkan lapisan teks tersembunyi, sehingga saya dapat mengindeks dokumen. Saya menggunakan ghostscript black dan white tiff output device (tiffg4) untuk mengekstrak halaman sebagai gambar tiff, dan berikut ini contoh tampilannya: Memproses gambar ini dengan tesseract, tidak memberikan hasil yang baik. Mengubah …