Apa distribusi kardinalitas dari persimpangan sampel acak independen tanpa penggantian?


10

S beberapa set dengannN elemen, dana1,a2,...,am tetap bilangan bulat positif kurang dari atau sama dengann .

Dengan unsur-unsur S yang sama mungkin, m sampel L1,L2,...,Lm secara terpisah dan independen yang diambil dari S tanpa penggantian, ukuran yang a1,a2,...,am , masing-masing.

|L1L2 ... Lm|{0,1,...,min{a1,a2,...,am}}


Saya bisa memberi Anda resep untuk menghitungnya secara rekursif, tetapi saya tidak mengetahui solusi bentuk tertutup. Apakah itu cukup, atau Anda ingin ekspresi eksplisit dari fungsi distribusi yang diberikan dan ? na1,,amn
Bridgeburners

@Bridgeburners Sebuah resep akan menyenangkan, setidaknya itu akan memberikan beberapa metode / cara untuk menyerang masalah ini dan yang terkait.
llrs

Jawaban:


3

Inilah pendekatan lain, yang tidak melibatkan rekursi. Masih menggunakan jumlah dan produk yang panjangnya tergantung pada parameter. Pertama saya akan memberikan ekspresi, lalu jelaskan.

Kami memiliki

P(|L1L2Lm|=k)=(nk)i=1n(nai)j=0min(a1,,am)k(1)j(nkj)l=1n(njkaljk).

EDIT: Pada akhir penulisan semua ini, saya menyadari bahwa kita dapat mengkonsolidasikan ekspresi di atas sedikit dengan menggabungkan koefisien binomial menjadi probabilitas hipergeometrik dan koefisien trinomial. Untuk apa nilainya, ungkapan yang direvisi adalah Di sini adalah variabel acak hypergeometrik di mana gambar diambil dari populasi ukuran memiliki status keberhasilan .Hyp(n,j+k,al)alnj+k

j=0min(a1,,am)k(1)j(nj,k,njk)l=1nP(Hyp(n,j+k,al)=j+k).
Hyp(n,j+k,al)alnj+k

Penurunan

Mari kita mendapatkan beberapa notasi untuk membuat argumen kombinatorial sedikit lebih mudah dilacak (mudah-mudahan). Sepanjang, kami menganggap dan tetap. Kami akan menggunakan untuk menunjukkan koleksi dari -tuples yang dipesan , di mana setiap , memuaskana 1 , , a m C ( I ) m ( L 1 , , L m ) L iSSa1,,amC(I)m(L1,,Lm)LiS

  • |Li|=ai ; dan
  • L1Lm=I .

Kami juga akan menggunakan untuk koleksi yang sama kecuali bahwa kami memerlukan alih-alih persamaan. L 1 L mIC(I)L1LmI

Pengamatan utama adalah bahwa relatif mudah untuk dihitung. Ini karena kondisi sama dengan untuk semua , jadi dalam arti ini menghapus interaksi antara berbagai nilai . Untuk setiap , jumlah memenuhi persyaratan adalah , karena kita dapat membuat dengan memilih subset dari dengan ukurandan kemudian bergabung dengan . Karena itu L 1 L mI L iIiii L i ( | S | - | I |C(I)L1LmILiIiiiLiLiSIai-| Saya| Saya| C(I)| =ni=1(|S|-|I|(|S|-|saya|Sebuahsaya-|saya|)L.sayaSsayaSebuahsaya-|saya|saya

|C(saya)|=saya=1n(|S|-|saya|Sebuahsaya-|saya|).

Sekarang probabilitas asli kita dapat diekspresikan melalui sebagai berikut: P ( | L 1L 2L m | = k ) = I : | Saya | = k | C ( I ) |C

P(|L.1L.2L.m|=k)=saya:|saya|=k|C(saya)|semua sayaS|C(saya)|.

Kami dapat membuat dua penyederhanaan di sini segera. Pertama, penyebutnya sama dengan Kedua, argumen permutasi menunjukkan bahwahanya tergantung pada melalui kardinalitas. Karena ada himpunan bagian dari memiliki kardinalitas , berikut bahwa mana adalah subset arbitrer, tetap dari memiliki kardinalitas| C(I)| Saya| Saya| (n

|C()|=saya=1n(|S|Sebuahsaya)=saya=1n(nSebuahsaya).
|C(saya)|saya|saya| SkI:| Saya| =k| C(I)| = ( n(nk)SkSaya0Sk
saya:|saya|=k|C(saya)|=(nk)|C(saya0)|,
saya0Sk .

Mengambil langkah mundur, kami sekarang telah mengurangi masalah untuk menunjukkan bahwa

|C(saya0)|=j=0min(Sebuah1,...,Sebuahm)-k(-1)j(n-kj)l=1n(n-j-kSebuahl-j-k).

Biarkan menjadi himpunan bagian yang berbeda dari dibentuk dengan menambahkan tepat satu elemen ke . Kemudian (Ini hanya mengatakan bahwa jika , maka berisi tetapi juga tidak mengandung elemen tambahan.) Kami sekarang telah mengubah masalah menjadi masalah penghitungan , yang kami tahu lebih banyak cara menanganinya. Lebih khusus, kami punya J1,...,Jn-kSsaya0

C(saya0)=C(saya0)(saya=1n-kC(Jsaya)).
L.1L.m=saya0L.1L.msaya0CC
|C(saya0)|=|C(saya0)|-|saya=1n-kC(Jsaya)|=l=1n(n-kSebuahl-k)-|saya=1n-kC(Jsaya)|.

Kita dapat menerapkan inklusi-pengecualian untuk menangani ukuran ekspresi gabungan di atas. Hubungan yang krusial di sini adalah, untuk setiap nonempty , Ini karena jika berisi sejumlah , maka ia juga mengandung gabungannya. Kami juga mencatat bahwa himpunan memiliki ukuran. Karena itu saya{1,...,n-k}

sayasayaC(Jsaya)=C(sayasayaJsaya).
L.1L.mJsayasayasayaJsaya|saya0|+|saya|=k+|saya|
|saya=1n-kC(Jsaya)|=saya{1,...,n-k}(-1)|saya|-1|sayasayaC(Jsaya)|=j=1n-ksaya:|saya|=j(-1)j-1l=1n(n-j-kSebuahl-j-k)=j=1n-k(-1)j-1(n-kj)l=1n(n-j-kSebuahl-j-k).
(Kita dapat membatasi nilai sini karena produk dari koefisien binomial adalah nol kecuali untuk semua , yaitu .)jjSebuahl-kljmin(Sebuah1,...,Sebuahm)-k

Akhirnya, dengan mengganti ekspresi di akhir ke dalam persamaan untukdi atas dan mengkonsolidasikan jumlah, kita memperoleh seperti yang diklaim.|C(saya0)|

|C(saya0)|=j=0min(Sebuah1,...,Sebuahm)-k(-1)j(n-kj)l=1n(n-j-kSebuahl-j-k)

Memberi +1 untuk semua upaya dan solusi, tetapi saya harus memoles matematika saya untuk memahami sebagian besar dari ini (dan jawaban lainnya). Terima kasih
llrs

4

Saya tidak mengetahui cara analitik untuk menyelesaikan ini, tapi inilah cara rekursif untuk menghitung hasilnya.

Untuk Anda memilih elemen dari yang telah dipilih sebelumnya. Probabilitas memilih elemen yang bersinggungan dengan dalam undian kedua Anda diberikan oleh distribusi hypergeometric:m=2Sebuah2n, Sebuah1kmin{Sebuah1,Sebuah2}L.1

P(kn,Sebuah1,Sebuah2)=(Sebuah1k)(n-Sebuah1Sebuah2-k)(nSebuah2).

Kita dapat memanggil hasilnyaKita dapat menggunakan logika yang sama untuk menemukan mana adalah kardinalitas dari persimpangan tiga sampel. Kemudian,b2.P(b3=kn,b2,Sebuah3),b3

P(b3=k)=l=0min(Sebuah1,Sebuah2)P(b3=kn,b2=l,Sebuah3)P(b2=ln,Sebuah1,Sebuah2).

Temukan ini untuk setiap . Perhitungan yang terakhir tidak sulit secara numerik, karena hanyalah hasil dari perhitungan sebelumnya dan adalah doa dari distribusi hypergeometric.k{0,1,2,...,min(Sebuah1,Sebuah2,Sebuah3)}P(b2=ln,Sebuah1,Sebuah2)P(b3=kn,b2=l,Sebuah3)

Secara umum, untuk menemukan Anda dapat menerapkan rumus rekursif berikut: untuk dan yang hanya mengatakan bahwaP(bm)

P(bsaya=k)=l=0min(Sebuah1,Sebuah2,...,Sebuahsaya-1)P(bsaya=kn,bsaya-1=l,Sebuahsaya)P(bsaya-1=l),
P(bsaya=kn,bsaya-1=l,Sebuahsaya)=(lk)(n-lSebuahsaya-k)(nSebuahsaya),
saya{2,3,...,m},
P(b1)=δSebuah1b1,
b1=Sebuah1.

Ini dia di R:

hypergeom <- function(k, n, K, N) choose(K, k) * choose(N-K, n-k) / choose(N, n)

#recursive function for getting P(b_i) given P(b_{i-1})
PNext <- function(n, PPrev, ai, upperBound) {
  l <- seq(0, upperBound, by=1)
  newUpperBound <- min(ai, upperBound)
  kVals <- seq(0, newUpperBound, by=1)
  PConditional <- lapply(kVals, function(k) {
    hypergeom(k, ai, l, n)
  })
  PMarginal <- unlist(lapply(PConditional, function(p) sum(p * PPrev) ))
  PMarginal
}

#loop for solving P(b_m)
P <- function(n, A, m) {
  P1 <- c(rep(0, A[1]), 1)
  if (m==1) {
    return(P1)
  } else {
    upperBound <- A[1]
    P <- P1
    for (i in 2:m) {
      P <- PNext(n, P, A[i], upperBound)
      upperBound <- min(A[i], upperBound)
    }
    return(P)
  }
}

#Example
n <- 10
m <- 5
A <- sample(4:8, m, replace=TRUE)
#[1] 6 8 8 8 5

round(P(n, A, m), 4)
#[1] 0.1106 0.3865 0.3716 0.1191 0.0119 0.0003
#These are the probabilities ordered from 0 to 5, which is the minimum of A

Terima kasih atas solusi Anda, dan kode Anda. Saya menunggu pendekatan jawaban lain (jika mereka datang) sebelum memberikan hadiah.
llrs
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.