[ EDIT # 1 oleh OP: Ternyata pertanyaan ini cukup baik dijawab oleh pencipta / pengelola exiftool Phil Harvey dalam utas rangkap di Forum ExifTool ]
[ EDIT # 2 oleh OP: Dari ExifTool FAQ : ExifTool tidak dijamin untuk menghapus metadata sepenuhnya dari file ketika mencoba menghapus semua metadata. Lihat 'Keterbatasan Penulis'.]
Saya ingin mencari di hard drive lama saya untuk foto-foto yang tidak ada di drive cadangan saya saat ini. Format termasuk jpg, png, tif, dll ..., serta berbagai format mentah (model kamera dan pabrikan berbeda).
Saya hanya tertarik pada keunikan gambar itu sendiri dan bukan keunikan karena perbedaan dalam, katakanlah, nilai-nilai tag exif, ada / tidaknya tag exif yang diberikan itu sendiri, thumbnail yang disematkan, dll ...
Meskipun saya tidak berharap menemukan korupsi / pembusukan data antara salinan berbeda dari gambar yang identik, saya ingin mendeteksi itu, serta perbedaan karena perubahan ukuran dan perubahan warna.
[ Sunting # 3 oleh OP: Untuk klarifikasi: Sebagian kecil positif palsu dapat ditoleransi (file dianggap unik ketika tidak) dan negatif palsu sangat tidak diinginkan (file salah disimpulkan sebagai duplikat). ]
Rencana saya adalah mengidentifikasi keunikan berdasarkan md5sums setelah menghapus semua metadata.
Bagaimana saya bisa menghapus metadata?
Akankah exiftool -all= <filename>
cukup?
find $dir -type f -regextype posix-extended -regex ".*\.(jpg|png|<...>|cr2|raw|raf|orf)"
mana <...>
berarti banyak sufiks lainnya.
convert image.jpg - | md5sum
(ImageMagick) memberi Anda jumlah MD5 yang sesuai.
file
akan gagal menemukan format gambar RAW danfind
hanya akan bekerja pada ekstensi (mungkin berguna untuk menggambarkan lebih baik apa yang Anda miliki)