Beberapa file PDF menghasilkan sampah (" mojibake ") ketika Anda menyalin teks (meskipun mereka membuat OK). Ini membuatnya mustahil untuk mencari mereka (apa pun yang Anda cari tidak akan cocok dengan sampah).
Adakah yang punya solusi mudah?
Contoh:
- Manual TEAC TV EU2816STF (menghasilkan masalah di atas pada Adobe Reader pada Windows dan Mac, tetapi berfungsi dengan baik di Pratinjau pada Mac)
- Panduan Leadtek Winfast PVR2 (tautan FTP; juga memiliki masalah dalam Pratinjau di Mac)
- Manual kartu TV tuner Swann (tautan FTP; juga memiliki masalah dalam Pratinjau di Mac)
- Perjanjian lisensi Phonedisc (dari DTMS yang sekarang tidak berfungsi )
- Tinjauan dana triwulanan Macquarie IFP
- Buklet Usaha Kecil BAN-TACS (versi diarsipkan)
- Selebaran Easterfest 2004 (juga dari arsip)
Saya menggunakan Adobe Reader (versi terbaru) untuk Windows - mungkin penampil alternatif dapat membantu? Saya mencari solusi gratis untuk Windows. Sumber terbuka akan lebih baik.
Sunting: Dokumen untuk alat Multivalent Extract Text memiliki ringkasan yang bagus tentang mengapa hal-hal bisa salah, termasuk: (dokumen yang dikutip terakhir dimodifikasi Jan 2006)
- Teks mungkin tidak memiliki pemetaan Unicode. Jenis huruf PDF 3 sering tidak, dan TeX DVI memiliki karakter yang tidak memiliki padanan Unicode.
- Pengkodean Unicode mungkin bermasalah. Open Office memetakan beberapa karakter ke dalam Unicode yang sama, menghasilkan huruf apparant yang dijatuhkan dan digandakan.
Saya kira solusi utama dalam kasus ini adalah dengan OCR setiap mesin terbang dalam font untuk mengetahui karakter apa itu sebenarnya. Perhatikan bahwa ini akan lebih mudah daripada OCRing dokumen pindaian berisik karena bentuk mesin terbang yang tepat tersedia (pada resolusi tak terbatas karena itu adalah gambar "vektor").
clipbrd.exe
(lihat mydigitallife.info/2008/11/06/... ) Anda dapat melihat apa yang ada di clipboard. Apa yang memberi Anda?