Saya memiliki pertanyaan yang hampir sama seperti ini: Bagaimana saya bisa memodelkan jumlah variabel acak Bernoulli secara efisien?
Tetapi pengaturannya sangat berbeda:
, , ~ 20, p_i ~ 0.1
Kami memiliki data untuk hasil variabel acak Bernoulli: ,
Jika kita memperkirakan dengan estimasi kemungkinan maksimum (dan mendapatkan ), ternyata jauh lebih besar daripada diharapkan oleh kriteria lain:
Jadi, dan tidak dapat diperlakukan sebagai independen (mereka memiliki ketergantungan kecil).
Ada beberapa batasan seperti ini: dan (dikenal), yang akan membantu dengan estimasi .
Bagaimana kita bisa mencoba memodelkan jumlah variabel acak Bernoulli dalam kasus ini?
Literatur apa yang bisa berguna untuk menyelesaikan tugas?
DIPERBARUI
Ada beberapa ide lebih lanjut:
(1) Dimungkinkan untuk mengasumsikan bahwa ketergantungan yang tidak diketahui antara dimulai setelah 1 atau lebih sukses secara seri. Jadi ketika , dan . ∑ i = 1 , K X i >0 p K + 1 → p ′ K + 1 p ′ K + 1 < p K + 1
(2) Untuk menggunakan MLE kita membutuhkan model yang paling tidak dipertanyakan. Berikut ini varian:
jika untuk setiap k jika dan , dan untuk semua k.P { X 1 , . . . , X k , X k + 1 , . . . , X N } = ( 1 - p 1 ) . . . p k P ' { X k + 1 , . . . , X N }X k = 1 P ' { X k + 1 = 1 , X k + 2 = 1 , . . . , X N = 1 } ≤ p k + 1 p k + 2 . . . p N
(3) Karena kami hanya tertarik pada kita dapat mengatur (probabilitas berhasil untuk N- (k + 1) +1 ringkasan dari ekor). Dan gunakan parametrization
(4) Gunakan MLE untuk model berdasarkan parameter dan dengan untuk (dan any ) dan beberapa batasan asli lainnya .
Apakah semuanya baik-baik saja dengan rencana ini?
DIPERBARUI 2
Beberapa contoh distribusi empiris (merah) dibandingkan dengan distribusi Poisson (biru) (rata-rata poisson adalah 2,22 dan 2,45, ukuran sampel adalah 332 dan 259):
Untuk sampel (A1, A2) dengan poisson berarti 2.28 dan 2.51 (ukuran sampel adalah 303 dan 249):
Untuk bergabung dengan samlpe A1 + A2 (ukuran sampel adalah 552):
Sepertinya beberapa koreksi ke Poisson harus menjadi model terbaik :).