Saya baru-baru ini menemukan Tesseract dan OpenCV . Sepertinya Tesseract adalah mesin OCR yang lengkap dan OpenCV dapat digunakan sebagai kerangka kerja untuk membuat aplikasi / layanan OCR.
Saya mencoba menggunakan Tesseract pada beberapa gambar saya dan akurasinya tampaknya lumayan. Kemudian, saya menemukan tutorial yang sangat sederhana tentang penggunaan OpenCV untuk melakukan OCR menggunakan Python dan saya terkesan. Dalam beberapa menit, saya menyelesaikan pelatihan sistem dan akurasinya bagus. Tapi tentu saja, mengambil pendekatan ini berarti saya perlu melatih sistem saya secara ekstensif menggunakan set pelatihan yang besar.
Pertanyaan spesifik saya adalah sebagai berikut:
- Bagaimana seseorang memilih antara Tesseract dan menggunakan OpenCV untuk membangun aplikasi OCR khusus?
- Ada set data pelatihan yang tersedia untuk Tesseract untuk berbagai bahasa. Apakah OpenCV memiliki sesuatu yang serupa sehingga saya tidak perlu memulai dari awal untuk mencapai OCR?
- Mana yang lebih baik untuk aplikasi komersial yang ingin menjadi?
Ada saran?