pendeknya:
Untuk mengetahui apakah sudah dikompresi:
strings your.pdf | grep /Filter
Untuk (membatalkan) kompres PDF, gunakan QPDF
qpdf --stream-data=compress your.pdf compressed.pdf
qpdf --stream-data=uncompress compressed.pdf uncompressed.pdf
penjelasan:
Kata kunci "Filter" di dalam file pdf adalah indikator dari metode kompresi yang digunakan. Beberapa dari mereka adalah:
CCITT G3 / G4 - digunakan untuk gambar monokrom
JPEG - algoritma lossy yang digunakan untuk gambar
JPEG2000 - alternatif yang lebih modern untuk JPEG, yang juga digunakan untuk mengompresi gambar
Flate - digunakan untuk mengompresi teks serta gambar
JBIG2 - alternatif untuk Kompresi CCITT untuk gambar monokrom
LZW - digunakan untuk mengompresi teks serta gambar tetapi diganti oleh Flate
RLE - digunakan untuk gambar monokrom
ZIP - digunakan untuk gambar abu-abu atau warna
(disalin dari sini ).
Namun, mengingat struktur file kompleks PDF, sebagian besar waktu sebagian (atau "aliran") dari PDF akan dikompresi dengan beberapa cara (dan akan muncul ketika grepping / Filter) sementara beberapa bagian lainnya tidak akan, jadi tidak ada jawaban YA / TIDAK untuk pertanyaan apakah PDF dikompresi.
salah satu cara untuk mengatasinya adalah dengan menambahkan -c
opsi ke grep, yang mengembalikan jumlah kemunculan, sehingga Anda dapat melihat secara relatif seberapa baik itu dikompresi. misalnya, jika pengembalian kurang dari 10 itu cukup tanpa kompresi.strings
"large
.pdf" | grep -c /Filter
Properti lain yang berkaitan dengan ukuran dalam PDF, adalah apakah mereka telah dioptimalkan untuk akses cepat, dengan ukuran PDF "yang dioptimalkan" menjadi lebih besar, mengutip dari wikipedia :
Ada dua tata letak untuk file PDF — non-linear (tidak "dioptimalkan") dan linear ("dioptimalkan"). File PDF non-linier menggunakan ruang disk lebih sedikit daripada rekan-rekan liniernya, meskipun mereka lebih lambat untuk diakses karena bagian dari data yang diperlukan untuk merakit halaman dokumen tersebar di seluruh file PDF. File PDF linier (juga disebut "dioptimalkan" atau "dioptimalkan web" file PDF) dibangun dengan cara yang memungkinkan mereka untuk dibaca dalam plugin browser Web tanpa menunggu seluruh file untuk diunduh, karena mereka ditulis ke disk dalam sebuah mode linear (seperti dalam urutan halaman). File PDF dapat dioptimalkan menggunakan perangkat lunak Adobe Acrobat atau QPDF.
Anda dapat memeriksa apakah PDF dioptimalkan menggunakan pdfinfo your.pdf
.
file
. Itu harus menunjukkan apakah file dikompresi atau tidak.