Apakah ada rumus untuk bentuk umum dari masalah pengumpul kupon?

Saya menemukan masalah pengumpul kupon dan mencoba menyusun formula untuk generalisasi.

Jika ada $N$ objek yang berbeda dan Anda ingin mengumpulkan setidaknya $k$ salinan masing-masing $m$ dari mereka (di mana $m \le N$ ), apa harapan dari berapa banyak objek acak yang harus Anda beli ?. Masalah pengumpul kupon normal adalah $m = N$ dan $k = 1$ .

Ada 12 angka LEGO berbeda dalam koleksi. Saya ingin mengumpulkan 3 salinan dari masing-masing 10 (setiap 10) angka. Saya dapat membelinya secara acak satu per satu. Berapa banyak yang harus saya harapkan untuk dibeli sebelum saya memiliki 3 salinan dari masing-masing 10 dari mereka?

— nickponline
sumber

Saya tidak ingat pernah melihat formula untuk generalisasi tertentu, tetapi untuk pertanyaan khusus satu kali seperti itu, saya cenderung menggunakan simulasi.

— Glen_b -Reinstate Monica

Ini tidak mudah untuk dihitung, tetapi dapat dilakukan, asalkan tidak terlalu besar. (Nomor ini menghitung status yang mungkin Anda perlu lacak saat mengumpulkan kupon.) $\binom{m+k}{k}$

Mari kita mulai dengan simulasi untuk mendapatkan jawaban. Di sini, saya mengumpulkan angka LEGO satu juta kali. Garis hitam dalam plot ini melacak frekuensi jumlah pembelian yang diperlukan untuk mengumpulkan setidaknya tiga dari sepuluh angka yang berbeda.

Pita abu-abu adalah perkiraan interval kepercayaan 95% dua sisi untuk setiap hitungan. Di bawahnya semua adalah kurva merah: ini adalah nilai sebenarnya.

Untuk mendapatkan nilai yang benar, pertimbangkan keadaan saat Anda mengumpulkan angka, di mana ada jenis yang mungkin dan Anda ingin mengumpulkan setidaknya dari jenis yang berbeda. Satu-satunya informasi yang perlu Anda perhatikan adalah berapa banyak angka yang belum Anda lihat, berapa banyak yang Anda lihat hanya sekali, berapa banyak yang telah Anda lihat dua kali, dan berapa banyak Anda telah melihat tiga kali atau lebih . Kita dapat mewakili ini dengan nyaman sebagai monomial mana adalah jumlah yang terkait, indeks dari hingga . Secara umum, kita akan menggunakan monomial dalam bentuk $n=12$ $k=3$ $m=10$ $x_0^{i_0} x_1^{i_1} x_2^{i_2} x_3^{i_3}$ $i_j$ $k=0$ $k=t$ $\prod_{j=0}^k x_j^{i_j}$ .

Setelah mengumpulkan objek acak baru, itu akan menjadi salah satu objek tak terlihat dengan probabilitas , salah satu objek yang terlihat hanya sekali dengan probabilitas , dan sebagainya. Hasilnya dapat dinyatakan sebagai kombinasi linear dari monomial, $i_0$ $i_0/n$ $i_1/n$

x_{0}^{i_{0}} x_{1}^{i_{1}} x_{2}^{i_{2}} x_{3}^{i_{3}} \to \frac{1}{n} (i_{0} x_{0}^{i_{0} - 1} x_{1}^{i_{1} + 1} x_{2}^{i_{2}} x_{3}^{i_{3}} + \dots + i_{3} x_{0}^{i_{0}} x_{1}^{i_{1}} x_{2}^{i_{2} - 1} x_{3}^{i_{3}}) .

$x_0^{i_0} x_1^{i_1} x_2^{i_2} x_3^{i_3}\to \frac{1}{n}\left(i_0 x_0^{i_0-1}x_1^{i_1+1}x_2^{i_2}x_3^{i_3} + \cdots + i_3 x_0^{i_0}x_1^{i_1}x_2^{i_2-1}x_3^{i_3}\right).$

Ini adalah hasil dari penerapan operator diferensial linier ke monomial. Jelas, aplikasi berulang ke keadaan awal akan memberikan polinomial , memiliki paling banyak istilah , di mana koefisien adalah kesempatan untuk berada dalam kondisi yang ditunjukkan oleh eksponennya. Kita hanya perlu fokus pada persyaratan dalam dengan : jumlah koefisien mereka akan menjadi peluang telah menyelesaikan pengumpulan kupon. Oleh karena itu seluruh perhitungan membutuhkan hingga $(x_1 D_{x_0} + x_2 D_{x_1} + x_3 D_{x_2} + x_3 D_{x_3})/n$ $x_0^{12}=x_0^n$ $p$ $\binom{n+k}{k}$ $\prod_{j=0}^k x_j^{i_j}$ $p$ $i_3 \ge t$ $(m+1)\binom{n+k}{k}$ perhitungan mudah pada setiap langkah, diulang sebanyak yang diperlukan untuk hampir pasti berhasil dengan koleksi.

Mengekspresikan proses dengan cara ini memungkinkan untuk mengeksploitasi efisiensi sistem aljabar komputer. Di sini, misalnya, adalah solusi Mathematica umum untuk menghitung peluang hingga hasil imbang. Itu menghilangkan beberapa kemungkinan, tetapi peluang totalnya kurang dari , memberi kita gambaran distribusi yang hampir lengkap. $6nk=216$ $10^{-17}$

n = 12;
threshold = 10;
k = 3;

(* Draw one object randomly from an urn with `n` of them *)
draw[p_] := 
  Expand[Sum[Subscript[x, i] D[#, Subscript[x, i - 1]], {i, 1, k}] + 
      Subscript[x, k] D[#, Subscript[x, k]] & @ p];

(* Find the chance that we have collected at least `k` each of `threshold` objects *)
f[p_] := Sum[
  Coefficient[p, Subscript[x, k]^t] /. 
   Table[Subscript[x, i] -> 1, {i, 0, k - 1}], {t, threshold, n}]

(* Compute the chances for a long series of draws *)
q = f /@ NestList[draw[#]/n &, Subscript[x, 0]^n, 6 n k];

Hasilnya, yang membutuhkan waktu sekitar dua detik untuk menghitung (lebih cepat dari simulasi!) Adalah berbagai probabilitas yang diindeks oleh jumlah undian. Berikut adalah plot perbedaannya, yang merupakan probabilitas untuk mengakhiri pembelian Anda sebagai fungsi dari penghitungan:

Ini adalah angka-angka yang digunakan untuk menggambar kurva latar belakang merah pada gambar pertama. (Uji chi-squared menunjukkan simulasi tidak berbeda secara signifikan dari perhitungan ini.)

Kami dapat memperkirakan jumlah undian yang diharapkan dengan menjumlahkan ; hasilnya harus baik hingga 14-15 tempat desimal. Saya mendapatkan (yang benar di setiap digit, sebagaimana ditentukan oleh perhitungan yang lebih panjang). $1-q$ $50.7619549386733$

— whuber
sumber