Tidak jelas apa yang Anda maksud dengan "kehilangan kualitas". Itu bisa berarti banyak hal yang berbeda. Bisakah Anda memposting beberapa sampel untuk diilustrasikan? Mungkin memotong bagian yang sama dari versi kualitas buruk dan kualitas yang baik (sebagai PNG untuk menghindari kehilangan kualitas lebih lanjut).
Mungkin Anda perlu menggunakan -density
untuk melakukan konversi pada dpi yang lebih tinggi:
convert -density 300 file.pdf page_%04d.jpg
(Anda dapat menambahkan -units PixelsPerInch
atau -units PixelsPerCentimeter
jika perlu. Salinan saya default ke ppi.)
Pembaruan: Seperti yang Anda tunjukkan, gscan2pdf
(cara Anda menggunakannya) hanyalah pembungkus untuk pdfimages
(dari poppler ). pdfimages
tidak melakukan hal yang convert
sama ketika mengisi PDF sebagai input.
convert
mengambil PDF, membuatnya pada beberapa resolusi, dan menggunakan bitmap yang dihasilkan sebagai gambar sumber.
pdfimages
melihat melalui PDF untuk gambar bitmap tertanam dan mengekspor masing-masing ke file. Ini hanya mengabaikan perintah menggambar teks atau vektor dalam PDF.
Akibatnya, jika yang Anda miliki adalah PDF yang hanya membungkus serangkaian bitmap, pdfimages
akan melakukan pekerjaan yang jauh lebih baik untuk mengekstraksinya, karena itu memberi Anda data mentah pada ukuran aslinya. Anda mungkin juga ingin menggunakan -j
opsi ini pdfimages
, karena PDF dapat berisi data JPEG mentah. Secara default, pdfimages
mengonversikan semuanya ke format PNM, dan mengonversi JPEG> PPM> JPEG adalah proses yang hilang.
Jadi, cobalah
pdfimages -j file.pdf page
Anda mungkin atau mungkin tidak perlu mengikuti dengan convert
ke .jpg
langkah (tergantung pada apa bitmap memformat PDF itu menggunakan).
Saya mencoba perintah ini pada PDF yang saya buat sendiri dari serangkaian gambar JPEG. JPEG yang diekstraksi adalah byte-untuk-byte yang identik dengan gambar sumber. Anda tidak bisa mendapatkan kualitas yang lebih tinggi dari itu.