Saya memiliki situs warisan yang cukup besar dengan ribuan PDF yang kadang-kadang terhitung dalam database, tetapi sering hanya tautan di halaman, dan disimpan di sebagian besar direktori di situs.
Saya telah menulis perayap php untuk mengikuti semua tautan di situs saya, dan kemudian saya membandingkannya dengan dump pada struktur direktori, tetapi apakah ada sesuatu yang lebih mudah?