Jika Anda ingin menggabungkan teks yang rusak sambil mempertahankan sebanyak format, penempatan, paragraf dan tipografi teks yang ada sebanyak mungkin, daripada menempel ke area teks yang baru dibuat sebagai teks biasa, Anda dapat mencoba John Wundes ' skrip Gabung Teks Bingkai menakjubkan .
Ia melakukan persis seperti yang tertulis di kaleng: menggabungkan potongan teks menjadi satu potongan teks, dengan membuat penilaian cerdas berdasarkan di mana mereka relatif satu sama lain:
- Ini menggabungkan potongan teks yang berdekatan (misalnya dari baris teks yang rusak dari PDF) menjadi baris tunggal, dengan beberapa kontrol yang ditawarkan tentang seberapa dekat dianggap sebagai baris yang sama.
- Ini menggabungkan baris teks yang terpisah menjadi satu objek teks multi-baris dengan teks dalam urutan yang benar (atas ke bawah), memperbaiki paragraf yang rusak.
- Lalu ada opsi untuk mengembalikan format asli dari semua teks yang digabungkan. Ini bisa memakan waktu cukup lama, tetapi ini membantu memberi Anda perkiraan yang cukup akurat tentang berapa lama waktu yang dibutuhkan dan opsi untuk melewati jika tidak layak.
Itu sangat bagus!
Perhatikan bahwa ini hanya berfungsi pada teks titik, bukan teks area (baik di sini karena PDF hampir selalu berupa teks titik). Jika Anda mencoba menggabungkan teks area dengan alasan apa pun, Anda dapat mengonversinya dengan skrip 'Make point text' Kartografi Kelso
Hal ini juga berguna digunakan bersama dengan AjarProductions' Convert to Text Area Script (Kelso Kartografi juga memiliki naskah yang sama, lihat link di atas), jika Anda ingin kembali teks patah di dalam area teks yang tepat dengan paragraf auto-mengalir:
- Pilih snipet teks yang rusak, jalankan skrip Join Text Frames
- Salin dan tempel teks ke dalam editor teks yang memungkinkan Anda menemukan / mengganti karakter paragraf (misalnya InDesign, editor teks biasa coder, atau mungkin bahkan sesuatu seperti ( bisikan ) Word ...)
Temukan / ganti ujung jeda baris yang tidak diinginkan. Jika ada banyak paragraf terpisah yang ingin Anda pertahankan, 1) Anda yakin tidak akan lebih baik menggunakan InDesign? 2) Anda bisa melakukannya seperti ini:
- Temukan / ganti dua penanda paragraf berurutan dengan beberapa penampung teks yang tidak muncul di mana pun dalam teks (mis.
\|\C.L.O.W.N.H.O.R.R.O.R/|/
)
- Temukan / ganti penanda paragraf dengan apa-apa atau spasi: mengubahnya menjadi satu baris panjang teks dengan semburan sesekali
\|\C.L.O.W.N.H.O.R.R.O.R/|/
- Temukan / ganti
\|\C.L.O.W.N.H.O.R.R.O.R/|/
karakter paragraf baru - yang menempatkan satu paragraf di mana pun dua paragraf sebelumnya.
Salin teks kembali, dan jalankan skrip Convert to Text Area di atasnya. Sekarang satu area teks yang mengalir dengan paragraf istirahat di tempat yang tepat.
Sayangnya, tidak ada yang dapat memperbaiki teks yang diuraikan kecuali menghentikannya diuraikan, mengetik ulang, atau mempercayai perangkat lunak OCR yang berpotensi cerdik.