Saya ingin menguji bagaimana situs saya akan berperilaku ketika jelajahi. Namun, saya ingin mengecualikan semua URL yang mengandung kata "halaman". Saya mencoba:
$ wget -r -R "*page*" --spider --no-check-certificate -w 1 http://mysite.com/
The -R
bendera seharusnya menolak pola URL yang mengandung kata "halaman". Kecuali bahwa itu tampaknya tidak berhasil:
Spider mode enabled. Check if remote file exists.
--2014-06-10 12:34:56-- http://mysite.com/?sort=post&page=87729
Reusing existing connection to [mysite.com]:80.
HTTP request sent, awaiting response... 200 OK
Bagaimana cara mengecualikan spidering URL tersebut?