Saya memiliki beberapa ribu halaman halaman buku yang dipindai. Setiap halaman disimpan secara individual sebagai JPG. Tulisannya jelas, tetapi fontnya bervariasi, dan halaman-halamannya memuat gambar dan ilustrasi.
Saya perlu membuat daftar semua kata yang muncul di setiap file JPG. Apakah ada alat baris perintah untuk memindai gambar yang mencantumkan kata-kata yang muncul? Tidak perlu memiliki pemindaian yang sempurna, hanya perkiraan.