Buat pdf dari buku HTML


16

Ada beberapa situs yang menyediakan buku sebagai halaman HTML (mis. Barang legal).

Apa yang dapat saya gunakan untuk membuat buku PDF dari halaman-halaman ini, berdasarkan pada struktur yang sudah ada?

Di Windows ada Adobe Professional (perangkat lunak komersial). Saya menduga bahwa Linux memiliki sesuatu yang gratis? Sebuah solusi yang melibatkan scripting tidak masalah bagi saya.

Jawaban:


9

Calibre adalah alat yang sangat kuat untuk mengubah segala sesuatu menjadi ebooks dalam berbagai format. Tersedia di Pusat Perangkat Lunak di dekat Anda!

Jangan tertipu oleh UI yang kurang indah, itu bisa melakukan banyak hal.


1
kaliber juga dilengkapi dengan alat baris perintah, ebook-convert. Maka dengan itu bisa Anda lakukan for file in *.html ; do ebook-convert "$file" "${file%.html}.pdf" ; donedan itu akan mengkonversi semua file html di folder ke PDF.
frabjous

1
Ini adalah alat yang baik, saya juga pengguna Kaliber, saya pikir yang terbaru telah menandai peningkatan di UI.
Sabacon

4

Cara termudah? File> Cetak dari browser Anda. Pilih Print to File sebagai printer Anda, dan ia akan menanyakan di mana Anda menginginkannya. Pastikan untuk menandai PDF. Tekan "Cetak" dan itu benar-benar akan disimpan ke drive Anda daripada benar-benar mencetak.


Terima kasih. Ada banyak file. Manuver ini praktis tidak mungkin.
Lucian Sasu

4

Htmldoc dapat bermanfaat, lihat di sini; http://www.htmldoc.org/ tersedia dari pusat perangkat lunak, sayangnya versi 1.8 memiliki masalah dengan file yang disandikan unicode tetapi pada banyak kesempatan masih bisa menjadi penyelamat, masalahnya diperbaiki dalam versi pengembangan 1.9.

Saya biasanya menggunakan ekstensi lembar memo indah di sini; http://amb.vis.ne.jp/mozilla/scrapbook/ untuk Firefox untuk mengambil halaman web, gunakan alat pengeditan di lembar memo untuk memperbaikinya jika diperlukan dan kemudian gunakan htmldoc untuk mengonversi semua halaman menjadi PDF.



3

Saya akan merekomendasikan menggunakan OpenOffice / LibreOffice untuk membuat PDF. Sebagai tes saya mengunduh manul Wget (semua dalam satu halaman) dan kemudian membuka halaman HTML di OponOffice dan mengklik tombol "Ekspor Langsung ke PDF". Itu menciptakan PDF dengan indeks dari daftar isi.

Di masa lalu saya menemukan ini sebagai cara termudah untuk mengkonversi halaman HTML ke PDF. Ini juga memungkinkan Anda untuk membuat perubahan tanpa banyak usaha.

Tangkapan layar:

  • Manual Wget diekspor ke PDF menggunakan Open Office Manual Wget diekspor ke PDF menggunakan Open Office

  • Ekspor Langsung ke opsi PDF di Open Office Ekspor Langsung ke opsi PDF di Open Office


Adakah ide jika buku itu tidak ada dalam satu halaman, tetapi terbagi dalam beberapa bab / bagian?
Ciprian Tomoiagă

2

Saya sebenarnya memilih solusi kaliber. Tapi ini satu lagi yang bisa Anda coba. Instal AbiWord . Ia dapat melakukan konversi antara format apa pun yang diketahuinya dari baris perintah. Untuk mengonversi semua file .html dalam folder ke .pdf, Anda dapat melakukan:

for file in *.html ; do abiword --to=pdf "$file" ; done

Untuk tipografi level yang lebih tinggi (tapi bisa dibilang lebih rumit), opsi lain adalah PrinceXML .


2

Bergantung pada dokumen html yang akan dicetak, Anda mungkin mendapatkan hasil terbaik menggunakan pandoc . Ini adalah salah satu konverter HTML-ke-LaTeX yang paling serbaguna. File .tex yang dihasilkan dapat diubah ke PDF dengan mudah, menggunakan xelatexatau pdflatex. Banyak opsi tersedia jika Anda ingin mempelajari sintaks dan paket LaTeX. Ini mungkin tidak berfungsi dengan baik jika gambar yang disematkan dan gaya HTML mewah harus dipertahankan.


1

Di google-chrome, Anda dapat membuat file pdf untuk seluruh situs dengan menggunakan ekstensi. Saya pribadi menggunakan ekstensi Web2PDF Converter yang membuat PDF hanya dengan sekali klik.

Berikut ini adalah screenshot dari plugin ini, yang disediakan oleh situs ekstensi web toko google.

masukkan deskripsi gambar di sini

Selain itu, Anda dapat melihat PDF yang dibuat oleh saya dengan alat ini, dengan mengunduh yang berikutnya (klik kanan, simpan target sebagai): http://geppettvs.servehttp.com/resources/askubuntu-com.pdf (beberapa browser seperti google- chrome memungkinkan Anda melihat ini secara online).

Dan jika Anda ingin mengedit PDF yang dibuat oleh ekstensi untuk menghapus tanda tangan digital yang ditempatkan oleh ekstensi di bagian bawah setiap halaman atau untuk menghapus yang lain, lihat ini: Hapus informasi teks dari PDF?

Semoga berhasil!

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.