Jawaban Ignacio baik-baik saja. Bahkan, itu akan menjadi hal pertama dalam daftar saya. Nah, itu dan mungkin untuk menyarankan pdftohtmlalat yang juga dilengkapi dengan poppler, dikombinasikan dengan pdfreflow jika Anda ingin mencoba merakit kembali teks menjadi paragraf, dll. (Tentu saja, ini akan memberikan Anda hasil HTML, tetapi mengubah HTML menjadi teks biasa dapat dilakukan dengan banyak cara.)
Berikut ini beberapa opsi lain juga.
The ebook-converttool baris perintah dari Calibre , yang dapat mengkonversi .PDFs ke teks biasa (atau RTF atau sejumlah format ebook, seperti ePub, dll)
pdftxtextractdari Podofo
Abiword dapat dipanggil dari commandline untuk mengkonversi antara format apa pun yang dapat dimasukkan / diekspor ke, dan dengan plugin impor yang sesuai, ini termasuk PDF:
abiword --to=txt file.pdf
(Dalam keadilan, saya pikir AbiWord dan kaliber keduanya menggunakan perpustakaan poppler, tapi saya tidak positif.)