Jelajahi Struktur PDF Internal


18

Bagaimana cara menjelajah struktur PDF internal di adobe 9.0?

Saya tidak menemukan menu lanjutan yang memiliki opsi ini.

Bisakah ada yang membantu saya?

pdf 

Jawaban:


23

Ada beberapa cara untuk menjelajahi struktur internal PDF.

PDF agak terbaca oleh manusia

Kecuali kata sandi keamanan, sebagian besar dapat dibaca oleh manusia. Jika PDF memiliki kata sandi, semua string dan stream (yang sudah dikompres, tidak akan hilang) akan menjadi pseudorandom sampah. Banyak data yang terkompresi mengalir, tetapi sebagian besar terlihat seperti ini di editor teks favorit Anda:

2 0 obj
<< /Type /Page 
   /MediaBox [0 0 612 792]
   /Contents 4 0 R
   /Resources << /Fonts 
     << /F1 5 0 R>> 
   >>
>>
endobj

Peringatan: Ruang putih sebagian besar tidak relevan dan biasanya dihapus jika memungkinkan. Saya hanya membuat ini cantik untuk membuatnya lebih mudah memahaminya.

<< dan >> mulai dan akhiri "kamus". Kamus terdiri dari pasangan kunci / nilai. Kuncinya selalu berupa "nama": semua nama dimulai dengan '/'. Nilainya bisa apa saja, termasuk nama lain.

[ dan ] mulai dan akhiri "array". Array dapat terdiri dari apa saja.

Angka adalah "angka". Titik apung atau sebaliknya.

() dan <> mulai dan akhiri "string". <> string terdaftar sebagai nilai hex, () adalah string ANSI.

Pet Peeve: / Nama dan (Strings) menggunakan sistem pelarian yang sama sekali berbeda. Grr.

Referensi Tidak Langsung menunjuk ke objek lain dalam PDF:
<objNum> <generationNum-AlwaysZero> R

Dalam objek contoh di atas, aliran konten di objek 4, di tempat lain dalam PDF. Untuk menemukannya, Anda dapat menggunakan editor teks Anda mencari "N 0 obj" di mana N adalah nomor objek yang Anda inginkan.
PERINGATAN: Ada ratusan, mungkin ribuan objek dalam PDF. Mencari "1 0 obj" akan memberi Anda BANYAK hit.

Mengingat Anda meminta untuk melihat struktur internal, Anda mungkin sudah mengetahui semua ini. Orang lain yang ingin mengetahui hal yang sama mungkin tidak.

PERINGATAN: Jangan EDIT PDF di editor teks. Semua hal-hal biner akan hancur, byte byte sangat penting dalam PDF.

Plugin Acrobat [s]

Ada plugin acrobat yang disebut PDF CanOpener oleh Windjack Solutions (tidak ada afiliasi). Ini SLICK. Anda dapat menelusuri struktur PDF sebagai pohon, melihat (dan memodifikasi) aliran konten, dan sebagainya.

Aplikasi Pesta Thirdy

Banyak. Banyak orang membangunnya sebagai bagian dari belajar mengurai PDF, atau sebagai alat debugging. Mereka Cukup Berguna.

RUPS iText (bagian dari iText, Java PDF lib):
https://sourceforge.net/projects/itext/

Browser Objek PDF:
http://ulc-community.canoo.com/snipsnap/space/PDF+Object+Browser

PDF Vole:
https://java.net/projects/pdfvole


1
PDF Voletampaknya rusak sekarang ...
DNA

5
+1 untuk iText RUPS, bukan GUI yang ramah tetapi berfungsi, dengan cara saat ini tampaknya URL proyek ( sourceforge.net/projects/itextrups )
Jaime Hablutzel

2
RUPS iText telah dipindahkan ke sini: github.com/itext/rups
bmaupin

1
Ada salinan kode sumber pdfvole di sini: github.com/Rossi1337/pdf_vole
yms

String <> heksadesimal mengandung angka mesin terbang. Untuk mengonversinya menjadi karakter Unicode, gunakan ToUnicodepeta font. stackoverflow.com/a/22763451/99237
Tereza Tomcova




2

Editor PDF-XChange gratis memiliki panel Konten yang memungkinkan Anda melihat struktur pohon dari file PDF.

View -> Panes -> Content

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.