Jawaban Ignacio baik-baik saja. Bahkan, itu akan menjadi hal pertama dalam daftar saya. Nah, itu dan mungkin untuk menyarankan pdftohtml
alat yang juga dilengkapi dengan poppler, dikombinasikan dengan pdfreflow jika Anda ingin mencoba merakit kembali teks menjadi paragraf, dll. (Tentu saja, ini akan memberikan Anda hasil HTML, tetapi mengubah HTML menjadi teks biasa dapat dilakukan dengan banyak cara.)
Berikut ini beberapa opsi lain juga.
The ebook-convert
tool baris perintah dari Calibre , yang dapat mengkonversi .PDFs ke teks biasa (atau RTF atau sejumlah format ebook, seperti ePub, dll)
pdftxtextract
dari Podofo
Abiword dapat dipanggil dari commandline untuk mengkonversi antara format apa pun yang dapat dimasukkan / diekspor ke, dan dengan plugin impor yang sesuai, ini termasuk PDF:
abiword --to=txt file.pdf
(Dalam keadilan, saya pikir AbiWord dan kaliber keduanya menggunakan perpustakaan poppler, tapi saya tidak positif.)