Terima kasih atas semua jawabannya, semuanya. Dengan bantuan Anda, saya dapat menyusun daftar perintah yang dapat mengekstrak jumlah halaman dari hampir semua dokumen kantor yang relevan:
DOCX / PPTX
unzip -p 'sample.docx' docProps/app.xml | grep -oP '(?<=\<Pages\>).*(?=\</Pages\>)'
unzip -p 'sample.pptx' docProps/app.xml | grep -oP '(?<=\<Slides\>).*(?=\</Slides\>)'
Catatan : unzip
dapat diinstal dengan sudo apt-get install unzip
.
DOC / PPT
wvSummary sample.doc | grep -oP '(?<=of Pages = )[ A-Za-z0-9]*'
wvSummary sample.ppt | grep -oP '(?<=of Slides = )[ A-Za-z0-9]*'
Catatan : wvSummary
(case-sensitive!) Adalah bagian dari wv
paket. Instal dengan sudo apt-get install wv
.
ODT
unzip -p sample.odt meta.xml | grep -oP '(?<=page-count=")[ A-Za-z0-9]*'
PDF
pdfinfo sample.pdf | grep -oP '(?<=Pages: )[ A-Za-z0-9]*'
Catatan: pdfinfo
adalah bagian dari poppler-utils
dan harus diinstal sebelumnya di Ubuntu.
DJVU
djvused -e "n" sample.djvu
Catatan: djvused
adalah bagian dari djvulibre-bin
paket dan dapat diinstal bersama sudo apt-get install djvulibre-bin
.