HTTP tidak benar-benar memiliki gagasan tentang direktori. Garis miring selain dari tiga yang pertama ( http://example.com/
) tidak memiliki arti khusus kecuali sehubungan dengan ..
dalam URL relatif. Jadi kecuali server mengikuti format tertentu, tidak ada cara untuk "mengunduh semua file di direktori yang ditentukan".
Jika Anda ingin mengunduh seluruh situs, taruhan terbaik Anda adalah dengan melintasi semua tautan di halaman utama secara rekursif. Curl tidak bisa melakukannya, tetapi wget bisa. Ini akan berfungsi jika situs web tidak terlalu dinamis (khususnya, wget tidak akan melihat tautan yang dibangun oleh kode Javascript). Mulailah dengan wget -r http://example.com/
, dan lihat di bawah "Opsi Pengambilan Rekursif" dan "Opsi Penerimaan / Tolak Rekursif" di manual wget untuk opsi yang lebih relevan (kedalaman rekursi, daftar pengecualian, dll).
Jika situs web mencoba memblokir unduhan otomatis, Anda mungkin perlu mengubah string agen pengguna ( -U Mozilla
), dan mengabaikan robots.txt
(membuat file kosong example.com/robots.txt
dan menggunakan -nc
opsi sehingga wget tidak mencoba mengunduhnya dari server).