Evernote melakukan OCR pada gambar yang Anda simpan. Apakah ada cara untuk mendapatkan teks lengkap yang setara dengan gambar di Evernote, atau apakah OCR hanya untuk pencarian?
Evernote melakukan OCR pada gambar yang Anda simpan. Apakah ada cara untuk mendapatkan teks lengkap yang setara dengan gambar di Evernote, atau apakah OCR hanya untuk pencarian?
Jawaban:
Evernote API memiliki fungsi untuk mendapatkan teks dan persegi panjang di mana teks ini ada di dalam gambar. Lihat http://evernote.com/about/developer/api/evernote-api.htm , lihat "Format XML Indeks Pengenalan Evernote" dan fungsinya untuk mengambilnya. Masalahnya adalah bahwa mereka tidak melakukan OCR tradisional ... algoritma OCR mereka dapat menghasilkan kata-kata yang berbeda untuk "kata" tunggal pada gambar. Semua yang mereka gunakan untuk pencarian, jadi ini baik untuk mereka, tetapi tidak baik untuk menggunakannya sebagai mesin pengenalan. (Meskipun mereka memberi Anda bobot untuk setiap alternatif kata, jadi mungkin Anda bisa menggunakannya)
Juga, Evernote tampaknya tidak memutuskan gambar tertentu setara dengan satu kata - misalnya, Evernote tidak menentukan bahwa gambar tertentu adalah "petunjuk" dan bukan "karena". Sebaliknya, ini akan melacak keduanya, dan pencarian untuk keduanya akan menghasilkan gambar yang sama. Oleh karena itu, tidak ada cara untuk mendapatkan teks lengkap yang setara karena Evernote tidak memutuskan apa sebenarnya teks itu, hanya apa yang bisa dilakukan.
evernote membayar jumlah yang layak kepada pencipta barang-barang atau ATAU membayar jumlah yang layak untuk menyatukan sesuatu. jadi, saya benar-benar ragu bahwa mereka akan membiarkan Anda mendapatkan teks yang diekstrak (+ memposisikan pada gambar).
(bisa menjadi model bisnis, untuk memindai gambar orang lain dan memberikan ocr yang baik :))
jadi, jawabannya adalah: tidak.
Saya tidak yakin berapa banyak kecanggihan yang Anda butuhkan, tetapi karena saya juga menggunakan Adobe Acrobat, saya cukup klik kanan pada lampiran Evernote saya untuk membuka dengan Acrobat.
Kemudian dari dalam Acrobat saya pilih "Document | OCR text recognition", lalu simpan dokumen sebagai teks biasa.
Ini berfungsi baik bagi saya karena saya hanya perlu konversi OCR sesekali.
Jika Anda bisa mendapatkan semua gambar dari Evernote, Anda bisa melakukan OCR dengan Google Documents.
Anda dapat mengunggah folder gambar ke Google Documents dan mengonversinya ke Dokumen, yang akan berisi gambar dan teks OCR.
Anda kemudian dapat mengunduh semua dokumen ini sebagai teks biasa, yang akan menghapus gambarnya.
Jika Anda memberi nama semua gambar Evernote dengan hash (mis. md5
), Akan mudah untuk menautkan file teks biasa yang diunduh dari Google Documents dengan gambar asli.
Saya menggunakan Windows dan menggunakan Adobe Acrobat Pro dan Word jadi saya melakukan hal berikut: