wget error "Konversi tautan di" url "Urutan multibyte tidak lengkap atau tidak valid yang ditemui"


2

Saya mencoba membantu kolega di Macbook Air MacOsx 10.11.06 dengan mengarsipkan situs web menggunakan wget (versi 1.19.1) diinstal melalui minuman. Menggunakan perintah ini.

wget --recursive --no-clobber --page-requisites --html-extension --convert-links --restrict-file-names=windows --domain scart.be --warc-file=20161103_scart www.scart.be

Namun ini menghasilkan kesalahan di terminal:

Konversi tautan di http://www.scart.be/index.html?q=fr%2Fnode%2F1135.html 35-27 Terjadi rangkaian multibyte yang tidak lengkap atau tidak valid.

Saya mengujinya dan bekerja dengan baik pada mesin xenial Ubuntu (wget versi 1.17.1) dan pada sistem lain, MacOsx 10.11.06. (wget versi 1.19.1)

Saya telah mencoba mengubah "--restrict-file-names = windows" menjadi "--restrict-file-names = nocontrol", tidak ada yang berubah. Jika kami mencoba mengimpor file .warc ke Webrecorder-player, ia menampilkan "tidak ada bookmark yang ditemukan" di mana ia bekerja dengan file .warc yang dibuat pada dua mesin lain yang disebutkan sebelumnya. Apa yang saya temukan sejauh ini di situs lain, adalah bahwa kesalahan ini terkait dengan pengkodean karakter dan telah terjebak di sana.


Anda mungkin perlu terlebih dahulu menemukan laman web yang tepat yang menyebabkan masalah, untuk melihat bagian dalamnya jika beberapa karakter memiliki penyandian yang tidak valid. Juga apakah masalah Anda berulang berulang kali? Kalau tidak, itu bisa menjadi masalah jaringan sementara atau bahkan masalah ruang yang tidak cukup untuk mengunduh semuanya?
Patrick Mevzek
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.