Analisis tradisional baik-baik saja. Analisis "tradisional" adalah, jika dijelaskan dengan benar, perkiraan; ini didasarkan pada penghitungan jumlah sel yang diharapkan yang 0/1 ketika Anda hash kunci ke filter, dan kemudian menganalisis seolah-olah itu adalah jumlah aktual. Intinya adalah bahwa jumlah sel yang 0 (atau 1) terkonsentrasi ketat di sekitar harapan mereka, jadi ini perkiraan yang baik. Ini sudah terkenal, dan saya kira bisa ditemukan di artikel survei saya bersama Andrei Broder.
Makalah ini mengatakan bahwa sesungguhnya kinerja filter Bloom adalah variabel acak (sesuai dengan fraksi aktual dari 0/1 entri), dan jika Anda ingin menghitung kinerja itu dengan alasan tertentu, Anda perlu melakukan kombinatorik. Untuk filter yang lebih kecil, Anda akan melihat perbedaan yang tidak sepele.
Saya sudah bicara dengan penulis makalah ini. Analisis mereka baik-baik saja dan baik (meskipun saya berpendapat bahwa itu tidak dalam atau baru); motivasi mereka bahwa "analisis tradisional salah", saya pikir, dilebih-lebihkan.