Konverter PDF ke teks [tertutup]


9

Saya mencari cara "satu-klik" untuk mengambil PDF APA PUN dan mengubahnya menjadi teks biasa. Idealnya di OSX atau Linux.

Idealnya, solusinya akan mencakup fungsionalitas OCR, tetapi tidak harus selalu.

Prioritas utama adalah memiliki sesuatu yang dapat mengambil file APAPUN TANPA konfigurasi.

Jawaban:


23

Ada xpdf yang termasuk pdftotextbiner.

Pdftotext mengubah file Portable Document Format (PDF) menjadi teks biasa.

Di Linux ada penginstal yang tersedia. Tampaknya itu juga termasuk dalam poppler-utilspaket. Pada OS X Anda bisa menginstalnya menggunakan Homebrew (instal dulu) dan kemudian gunakan

brew install homebrew/x11/xpdf

yang akan mengunduh file sumber dan mengompilasinya untuk OS X. Setelah itu, gunakan saja seperti:

pdftotext your_pdf_file.pdf

yang akan menghasilkan file teks biasa. Ada beberapa opsi juga, periksa man pdftotextuntuk lebih jelasnya.

Alternatifnya adalah poppler , di OSX:

brew install poppler

di Debian dan teman-teman

apt-get install poppler-utils

pada hari ini perintahnya adalahbrew install homebrew/x11/xpdf
Diego Vieira

1
@DiegoVieira Terima kasih. Lain kali jangan ragu untuk menyarankan suntingan!
slhck

beberapa keuntungan menggunakan poppler daripada xpdf / pdftotext?
Gonzalo Bahamondez

brew install Caskroom/cask/pdftotext
Hugo

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.