Jawaban:
Terlihat gratis, Baru mencobanya dan ini bekerja dengan baik untuk saya.
Google Documents sekarang sedang menguji fitur API baru yang menggunakan OCR (Pengenalan Karakter Optik) pada gambar dan PDF.
Dari Sistem Operasi Google :
Google Docs API menguji fitur baru yang memungkinkan Anda melakukan OCR (pengenalan karakter optik) pada gambar. Ada demo langsung yang menggambarkan fitur ini : Anda dapat mengunggah gambar JPG, GIF, atau PNG resolusi tinggi yang memiliki kurang dari 10 MB dan Google Documents mengekstraksi teks dan mengubahnya menjadi dokumen baru. Google menyebutkan bahwa "operasi saat ini dapat memakan waktu hingga 40 detik" dan sebuah tes kecil menunjukkan bahwa layanan tersebut belum dapat diandalkan: lambat dan sering mengembalikan kesalahan.
Hasilnya jauh dari sempurna dan Anda akan menemukan banyak kesalahan, tetapi layanan ini gratis dan terus membaik. Inilah hasil OCR untuk dokumen yang dipindai ini :
Dokumen Google Documents dapat diekspor dalam sejumlah format berbeda, termasuk HTML, OpenOffice, dan Word:
Per jawaban saya di SO untuk Apakah ada yang tahu cara untuk dengan mudah mengkonversi PDF ke format docx secara terprogram :
Konversikan PDF ke SVG (ghostscript akan melakukannya) dan impor ...
... intinya adalah bahwa sementara Word tidak akan menanamkan PDF, itu akan menanamkan SVG.
Gunakan program pengenalan karakter optik, seperti Omnipage Pro misalnya. Ini mendukung PDF sebagai input dokumen dan Word sebagai output.
Anda juga dapat mencoba OCRTerminal yang menawarkan layanan gratis untuk 20 halaman per bulan. Mereka memiliki Klien Desktop Beta yang tampaknya tersedia untuk digunakan dengan undangan (Anda harus menghubungi mereka dan menyatakan minat).