Apakah ada beberapa program yang mudah digunakan di Ubuntu yang dapat memindai banyak halaman langsung ke file PDF?
Apakah ada beberapa program yang mudah digunakan di Ubuntu yang dapat memindai banyak halaman langsung ke file PDF?
Jawaban:
Gagasan memiliki utilitas pemindaian sederhana berada di belakang pengembangan, well, Simple Scan - alat pemindaian yang terinstal secara default dari 10,04 aktif (Aplikasi ‣ Grafik Scan Pemindaian Sederhana).
Cukup memindai halaman sebanyak yang Anda inginkan dan pilih format file PDF saat menyimpan.
Program lain yang sedikit kurang sederhana yang menawarkan fitur-fitur tambahan seperti pengenalan teks adalah gscan2pdf , juga di repositori.
"Mudah digunakan" ada di mata pengguna, tetapi xsane
menyediakan fungsionalitas ini. Pilih multipage di mana dikatakan viewer (atau tekan CTRL-M), dan seharusnya tidak terlalu sulit untuk mencari tahu dari sana.
Saya menggunakan xsane
sampai saya melihat pertanyaan ini dan menganggap antarmuka yang istimewa untuk sedikitnya, tetapi efektif.
Setelah melihat pertanyaan ini, saya mencari dan menemukan gscan2pdf tinggal di repositori Ubuntu Lucid / Maverick. Ini menggunakan mesin pemindaian (libsane) yang sama tetapi UI jauh lebih Gnome-ish. Untuk waktu yang baik, cobalah:
sudo apt-get install gscan2pdf
Ubah nama file dari myfile.jpg ke myfile.pdf pada dialog simpan Simple Scan.
Diuji pada Ubuntu 14.04, Simple Scan 3.12.1.
Ini berfungsi meskipun jenis file drop-down tidak menunjukkan "PDF", hanya "Gambar". Saya menganggap ini sebagai bug UI.
Fitur ini didokumentasikan pada Help > Contents
:
Dari kotak dialog "Simpan Sebagai", pilih salah satu jenis file yang didukung, atau cukup ganti ekstensi di bidang "Nama".
Dikatakan bahwa format berikut ini didukung:
Fakta menarik: jika Anda mengubah jenis pemindaian (dropdown selain "Pindai") menjadi "Teks", jenis file default menjadi PDF.
Memindai halaman dari pemindai USB. Gunakan tesseract untuk OCR ke dalam PDF. Gabungkan banyak halaman menjadi satu PDF. Penggunaan: scan2PDF outputfilename number_of_pages
#!/bin/bash
#scan2PDF
#Requires: tesseract 3.03 for OCR to PDF
# scanimage for scanning, I use 1.0.24
# pdfunite to merge multiple PDF into one, I use 0.26.5
#
# Use scanimage -L to get a list of devices.
# e.g. device `genesys:libusb:006:003' is a Canon LiDE 210 flatbed scanner
# then copy/paste genesys:libusb:006:003 into SCANNER below.
# play with CONTRAST to get good images
DPI=300
TESS_LANG=nor #Language that Tesseract uses for OCR
SCANNER=genesys:libusb:006:003 #My USB scanner
CONTRAST=35 #Contrast to remove paper look
FILENAME=$1 #Agrument 1,filename
PAGES=$2 #Argument 2, number of pages
re='^[0-9]+$' #Check if second argument is a number
if ! [[ ${PAGES} =~ $re ]] ; then
echo "error: Usage: $0 filename number_of_pages" >&2; exit 1
fi
SCRIPT_NAME=`basename "$0" .sh` #Directory to store temporary files
TMP_DIR=${SCRIPT_NAME}-tmp
if [ -d ${TMP_DIR} ] #Check if it exists a directory already
then
echo Error: The directory ${TMP_DIR} exists.
exit 2
fi
mkdir ${TMP_DIR} #Make and go to temp dir
cd ${TMP_DIR}
echo Starts Scanimage...
scanimage -d ${SCANNER} --format=tiff --mode Color --resolution ${DPI} -p --contrast ${CONTRAST} --batch-start=1 --batch-count=${PAGES} --batch-prompt
echo Starts Tesseract OCR
for file in *.tif #Goes through every tif file in temp dir
do
tesseract $file ${file%.tif} -l ${TESS_LANG} pdf
done
if [ "$PAGES" = "1" ] #How many pages
then
cp out1.pdf ../${FILENAME}.pdf #Only one page, just copy the PDF back
else
for file in *.pdf #More pages, merge the pages into one PDF and copy back
do
pdfuniteargs+=${file}
pdfuniteargs+=" "
done
pdfunite $pdfuniteargs ../${FILENAME}.pdf
fi
echo ${FILENAME}.pdf done
rm * #Done, clean up
cd ..
rmdir ${TMP_DIR}
Bagi Anda yang ingin menggunakan XSANE. Ini sangat kuat, dan intuitif setelah Anda membaca panduan pengaturan yang ditautkan dari Help> XSane Doc di program - untuk mengetahui seberapa banyak yang dapat Anda lakukan dengannya. Ada baiknya juga memeriksa backend SANE Anda berfungsi dengan baik (tidak terlalu spesifik Arch): https://wiki.archlinux.org/index.php/SANE
Jika Anda ingin memindai dokumen secara otomatis dari pengumpan, dan bertanya-tanya apakah XSane akan tahu kapan harus berhenti (dan tidak berhenti terlalu dini), cukup masukkan angka di kiri atas (ikon jumlah pemindaian) yang lebih besar daripada jumlah halaman yang sesuai. di pengumpan Anda. Yaitu jika feeder Anda dapat mengambil 10 halaman, lalu masukkan 15 (untuk memperhitungkan variasi ketebalan). Jika Anda memiliki pemindai dupleks, gandakan nomor ini.
Ketika feeder habis, Anda akan mendapatkan kotak dialog dengan segitiga peringatan hijau yang mengatakan "" Halaman yang dipindai: 0 ". Ini hanya berarti bahwa feeder kosong dan Anda dapat menutup dialog. Jika Anda memilih" viewer "atau" save " "di kanan atas XSane, maka semua file akan berada di sana - ingatlah untuk menyimpannya dari pemirsa. Sekarang Anda dapat menekan pindai lagi untuk melanjutkan di mana Anda tinggalkan, dengan angka-angka yang bertambah dari titik yang sama atau Anda dapat mulai proyek baru. Tidak akan ada halaman kosong yang ditambahkan. Jika Anda memilih "Multipage", dialog proyek akan menunjukkan semua pemindaian yang telah selesai dan Anda dapat mengklik untuk menyimpan sebagai PDF multi-halaman atau TIFF atau PostScript.
HTH,
DC