Mari menjadi terbatas himpunan dan misalkan kita ingin menghitung ukuran beberapa bagian .
Motivasi : Jika kita dapat menghasilkan elemen dari secara seragam secara acak, maka kita dapat memperkirakan ukuran dengan pengambilan sampel acak. Yaitu, kita mengambil sampel acak dari , jika di antaranya adalah , maka . Sayangnya, untuk apa yang saya lakukan, biasanyamasif dan(Sementara masif) cukup kecil sehubungan dengan. Jadi jika saya mencoba melakukan estimasi di atas, saya cenderung mendapatkan , yang, meskipun tidak sia-sia, tidak terlalu memuaskan.
Jadi, saya punya ide bahwa saya berharap akan mempercepat proses ini. Alih-alih melemparkan anak panah ke papan panah besar, mengapa saya tidak melempar bola? Artinya, bukan sampel elemen , kami subset sampel . Tentunya saya harus dapat menyimpulkan sesuatu tentang kepadatan dalam dari percobaan ini.
Misalkan dilengkapi dengan metrik (saya ingat jarak Hamming). Untuk setiap biarkan menjadi bola jari-jari tertutup dalam berpusat di . Karena kita dapat sampel elemen secara seragam secara acak, kita dapat mengambil sampel -balls secara seragam secara acak.
Misalkan (a) setiap milik persis jumlah yang sama dari -balls dan (b) setiap bola memiliki ukuran yang sama .
Sekarang anggaplah saya menghasilkan -balls secara seragam secara acak dan anggap. Sepertinya kita bisa memperkirakandengan cara yang sama, yaitu .
Jadi pertanyaan saya adalah:
Apakah saya benar karena kami dapat memperkirakancara ini? Jika demikian, saya ragu saya yang pertama memikirkan hal ini, jadi apakah ada nama untuk metode ini?
Saya benar-benar menguji ini pada beberapa set, dan tampaknya cocok dengan apa yang saya klaim.
Apakah ada kelemahan dari pendekatan ini? (mis. apakah kurang akurat? apakah saya perlu lebih banyak sampel?)