Jadi, filter Bloom cukup keren - mereka adalah set yang mendukung pemeriksaan keanggotaan tanpa negatif palsu, tetapi kemungkinan kecil positif palsu. Namun baru-baru ini, saya menginginkan "filter Bloom" yang menjamin yang sebaliknya: tidak ada positif palsu, tetapi berpotensi negatif palsu.
Motivasi saya sederhana: diberi aliran besar barang untuk diproses (dengan duplikat), kami ingin menghindari memproses barang yang telah kami lihat sebelumnya. Tidak ada salahnya memproses duplikat, itu hanya buang-buang waktu. Namun, jika kita lalai memproses suatu elemen, itu akan menjadi bencana besar. Dengan "reverse Bloom filter", seseorang dapat menyimpan barang-barang yang terlihat dengan sedikit overhead ruang, dan menghindari pemrosesan duplikat dengan probabilitas tinggi dengan menguji keanggotaan dalam set tersebut.
Namun sepertinya saya tidak dapat menemukan hal semacam itu. Yang paling dekat yang saya temukan adalah " filter Bloom retouched ", yang memungkinkan seseorang untuk bertukar positif palsu yang dipilih dengan tingkat negatif palsu yang lebih tinggi. Saya tidak tahu seberapa baik kinerja struktur data mereka ketika seseorang ingin menghapus semua positif palsu.
Adakah yang melihat hal seperti ini? :)