beberapa set dengan elemen, dan tetap bilangan bulat positif kurang dari atau sama dengan .
Dengan unsur-unsur yang sama mungkin, sampel secara terpisah dan independen yang diambil dari tanpa penggantian, ukuran yang , masing-masing.
beberapa set dengan elemen, dan tetap bilangan bulat positif kurang dari atau sama dengan .
Dengan unsur-unsur yang sama mungkin, sampel secara terpisah dan independen yang diambil dari tanpa penggantian, ukuran yang , masing-masing.
Jawaban:
Inilah pendekatan lain, yang tidak melibatkan rekursi. Masih menggunakan jumlah dan produk yang panjangnya tergantung pada parameter. Pertama saya akan memberikan ekspresi, lalu jelaskan.
Kami memiliki
EDIT: Pada akhir penulisan semua ini, saya menyadari bahwa kita dapat mengkonsolidasikan ekspresi di atas sedikit dengan menggabungkan koefisien binomial menjadi probabilitas hipergeometrik dan koefisien trinomial. Untuk apa nilainya, ungkapan yang direvisi adalah Di sini adalah variabel acak hypergeometrik di mana gambar diambil dari populasi ukuran memiliki status keberhasilan .Hyp(n,j+k,al)alnj+k
Mari kita mendapatkan beberapa notasi untuk membuat argumen kombinatorial sedikit lebih mudah dilacak (mudah-mudahan). Sepanjang, kami menganggap dan tetap. Kami akan menggunakan untuk menunjukkan koleksi dari -tuples yang dipesan , di mana setiap , memuaskana 1 , … , a m C ( I ) m ( L 1 , … , L m ) L i ⊆ S
Kami juga akan menggunakan untuk koleksi yang sama kecuali bahwa kami memerlukan alih-alih persamaan. L 1 ∩⋯∩ L m ⊇I
Pengamatan utama adalah bahwa relatif mudah untuk dihitung. Ini karena kondisi sama dengan untuk semua , jadi dalam arti ini menghapus interaksi antara berbagai nilai . Untuk setiap , jumlah memenuhi persyaratan adalah , karena kita dapat membuat dengan memilih subset dari dengan ukurandan kemudian bergabung dengan . Karena itu L 1 ∩⋯∩ L m ⊇I L i ⊇Iiii L i ( | S | - | I |LiS∖Iai-| Saya| Saya| C′(I)| =n∏i=1(|S|-|I|
Sekarang probabilitas asli kita dapat diekspresikan melalui sebagai berikut: P ( | L 1 ∩ L 2 ∩ ⋯ ∩ L m | = k ) = ∑ I : | Saya | = k | C ( I ) |
Kami dapat membuat dua penyederhanaan di sini segera. Pertama, penyebutnya sama dengan Kedua, argumen permutasi menunjukkan bahwahanya tergantung pada melalui kardinalitas. Karena ada himpunan bagian dari memiliki kardinalitas , berikut bahwa mana adalah subset arbitrer, tetap dari memiliki kardinalitas| C(I)| Saya| Saya| (n
Mengambil langkah mundur, kami sekarang telah mengurangi masalah untuk menunjukkan bahwa
Biarkan menjadi himpunan bagian yang berbeda dari dibentuk dengan menambahkan tepat satu elemen ke . Kemudian (Ini hanya mengatakan bahwa jika , maka berisi tetapi juga tidak mengandung elemen tambahan.) Kami sekarang telah mengubah masalah menjadi masalah penghitungan , yang kami tahu lebih banyak cara menanganinya. Lebih khusus, kami punya
Kita dapat menerapkan inklusi-pengecualian untuk menangani ukuran ekspresi gabungan di atas. Hubungan yang krusial di sini adalah, untuk setiap nonempty , Ini karena jika berisi sejumlah , maka ia juga mengandung gabungannya. Kami juga mencatat bahwa himpunan memiliki ukuran. Karena itu
Akhirnya, dengan mengganti ekspresi di akhir ke dalam persamaan untukdi atas dan mengkonsolidasikan jumlah, kita memperoleh seperti yang diklaim.
Saya tidak mengetahui cara analitik untuk menyelesaikan ini, tapi inilah cara rekursif untuk menghitung hasilnya.
Untuk Anda memilih elemen dari yang telah dipilih sebelumnya. Probabilitas memilih elemen yang bersinggungan dengan dalam undian kedua Anda diberikan oleh distribusi hypergeometric:
Kita dapat memanggil hasilnyaKita dapat menggunakan logika yang sama untuk menemukan mana adalah kardinalitas dari persimpangan tiga sampel. Kemudian,
Temukan ini untuk setiap . Perhitungan yang terakhir tidak sulit secara numerik, karena hanyalah hasil dari perhitungan sebelumnya dan adalah doa dari distribusi hypergeometric.
Secara umum, untuk menemukan Anda dapat menerapkan rumus rekursif berikut: untuk dan yang hanya mengatakan bahwa
Ini dia di R:
hypergeom <- function(k, n, K, N) choose(K, k) * choose(N-K, n-k) / choose(N, n)
#recursive function for getting P(b_i) given P(b_{i-1})
PNext <- function(n, PPrev, ai, upperBound) {
l <- seq(0, upperBound, by=1)
newUpperBound <- min(ai, upperBound)
kVals <- seq(0, newUpperBound, by=1)
PConditional <- lapply(kVals, function(k) {
hypergeom(k, ai, l, n)
})
PMarginal <- unlist(lapply(PConditional, function(p) sum(p * PPrev) ))
PMarginal
}
#loop for solving P(b_m)
P <- function(n, A, m) {
P1 <- c(rep(0, A[1]), 1)
if (m==1) {
return(P1)
} else {
upperBound <- A[1]
P <- P1
for (i in 2:m) {
P <- PNext(n, P, A[i], upperBound)
upperBound <- min(A[i], upperBound)
}
return(P)
}
}
#Example
n <- 10
m <- 5
A <- sample(4:8, m, replace=TRUE)
#[1] 6 8 8 8 5
round(P(n, A, m), 4)
#[1] 0.1106 0.3865 0.3716 0.1191 0.0119 0.0003
#These are the probabilities ordered from 0 to 5, which is the minimum of A