Saya ingin mendapatkan semua file untuk situs web yang diberikan di archive.org. Alasannya mungkin termasuk:
- penulis asli tidak mengarsipkan situs web sendiri dan sekarang offline, saya ingin membuat cache publik dari itu
- Saya adalah penulis asli dari beberapa situs web dan kehilangan beberapa konten. Saya ingin memulihkannya
- ...
Bagaimana aku melakukan itu ?
Mempertimbangkan bahwa mesin wayback archive.org sangat istimewa: tautan laman web tidak menunjuk ke arsip itu sendiri, tetapi ke laman web yang mungkin tidak lagi ada di sana. JavaScript digunakan sisi klien untuk memperbarui tautan, tetapi trik seperti wget rekursif tidak akan berfungsi.
gem install wayback_machine_downloader
. Jalankan wayback_machine_downloader dengan url dasar situs web yang ingin Anda ambil sebagai parameter:wayback_machine_downloader http://example.com
Informasi lebih lanjut: github.com/hartator/wayback_machine_downloader