Jawaban yang diterima saat ini melakukan pekerjaan tetapi menghasilkan output yang lebih besar dalam ukuran dan menderita kehilangan kualitas.
Tidak jelas apa yang Anda maksud dengan "kehilangan kualitas". Itu bisa berarti banyak hal yang berbeda. Bisakah Anda memposting beberapa sampel untuk diilustrasikan? Mungkin memotong bagian yang sama dari versi kualitas buruk dan kualitas yang baik (sebagai PNG untuk menghindari kehilangan kualitas lebih lanjut).
Mungkin Anda perlu menggunakan -densityuntuk melakukan konversi pada dpi yang lebih tinggi:
convert -density 300 file.pdf page_%04d.jpg
(Anda dapat menambahkan -units PixelsPerInchatau -units
PixelsPerCentimeterjika perlu. Salinan saya default ke ppi.)
Pembaruan: Seperti yang Anda tunjukkan, gscan2pdf(cara Anda menggunakannya) hanyalah pembungkus untuk pdfimages(dari poppler ). pdfimages
tidak melakukan hal yang convertsama ketika mengisi PDF sebagai input.
convert mengambil PDF, membuatnya pada beberapa resolusi, dan menggunakan bitmap yang dihasilkan sebagai gambar sumber.
pdfimagesmelihat melalui PDF untuk gambar bitmap tertanam dan mengekspor masing-masing ke file. Itu hanya mengabaikan perintah menggambar teks atau vektor dalam PDF.
Akibatnya, jika yang Anda miliki adalah PDF yang hanya membungkus serangkaian bitmap, pdfimagesakan melakukan pekerjaan yang jauh lebih baik untuk mengekstraksinya, karena itu memberi Anda data mentah pada ukuran aslinya. Anda mungkin juga ingin menggunakan -jopsi ini pdfimages, karena PDF dapat berisi data JPEG mentah. Secara default, pdfimagesmengonversikan semuanya ke format PNM, dan mengonversi JPEG> PPM> JPEG adalah proses yang hilang.
Jadi, cobalah
pdfimages -j file.pdf page
Anda mungkin atau mungkin tidak perlu mengikuti dengan convertke .jpglangkah (tergantung pada apa bitmap memformat PDF itu menggunakan).
Saya mencoba perintah ini pada PDF yang saya buat sendiri dari serangkaian gambar JPEG. JPEG yang diekstraksi adalah byte-untuk-byte yang identik dengan gambar sumber. Anda tidak bisa mendapatkan kualitas yang lebih tinggi dari itu.