Saya memiliki lebih dari 10.000 gambar yang sekitar 2000 adalah duplikat dalam format lain (seperti dalam JPEG, PNG, GIF). Kedua angka ini meningkat setiap hari. Saya perlu menghapus duplikat itu dan untuk itu saya harus tahu cara menemukannya terlebih dahulu.
Pikiran pertama saya adalah memeriksa piksel gambar dan menemukan gambar lain yang memiliki piksel berwarna sama di koordinat yang sama. Tetapi opsi ini tidak selalu berhasil. Katakanlah saya mencari duplikat. Adapun objek yang dapat dicari saya memilih file PNG 8 bit. Ini akan menemukan semua duplikat dari gambar itu, tetapi hanya PNG 8 bit, kadang-kadang 8bit GIF dan jarang JPEG (karena saya kira algoritmik gambarnya?).
Pikiran kedua saya adalah untuk menduplikasi semua gambar itu dan mewarnai ulang mereka dalam palet dua warna yang ketat (katakanlah hitam & putih) dan melakukan pemindaian yang sama seperti yang dinyatakan di atas. Sekali lagi gambar JPEG tidak 100% mirip dengan format PNG atau GIF (alasan yang sama seperti di atas?).
Pikiran ketiga adalah untuk mengurangi persentase pada seberapa banyak gambar perlu terbiasa dan meningkatkan seberapa banyak warna dapat bervariasi, menghasilkan penghapusan gambar yang tidak diinginkan ...
Adakah pikiran?