Misalkan saya cocok dengan regresi Binomial dan mendapatkan estimasi titik dan matriks varians-kovarians dari koefisien regresi. Itu akan memungkinkan saya untuk mendapatkan CI untuk proporsi keberhasilan yang diharapkan dalam percobaan di masa depan, , tetapi saya membutuhkan CI untuk proporsi yang diamati. Ada beberapa jawaban terkait yang diposting, termasuk simulasi (misalkan saya tidak ingin melakukan itu) dan tautan ke Krishnamoorthya et al (yang tidak cukup menjawab pertanyaan saya).
Alasan saya adalah sebagai berikut: jika kita hanya menggunakan model Binomial, kita dipaksa untuk mengasumsikan bahwa diambil sampel dari distribusi Normal (dengan Wald CI yang sesuai) dan oleh karena itu tidak mungkin untuk mendapatkan CI untuk proporsi yang diamati dalam bentuk tertutup. Jika kita mengasumsikan bahwa diambil sampel dari distribusi beta, maka segala sesuatunya jauh lebih mudah karena jumlah keberhasilan akan mengikuti distribusi Beta-Binomial. Kita harus mengasumsikan bahwa tidak ada ketidakpastian dalam estimasi parameter beta, dan .
Ada tiga pertanyaan:
1) Yang teoretis: apakah boleh menggunakan estimasi titik parameter beta saja? Saya tahu bahwa untuk membangun CI untuk pengamatan masa depan dalam regresi linier berganda
mereka melakukan itu varian istilah kesalahan kesalahan, . Saya mengambilnya (mengoreksi saya jika saya salah) bahwa pembenarannya adalah bahwa dalam praktiknya diperkirakan dengan presisi yang jauh lebih besar daripada koefisien regresi dan kami tidak akan mendapatkan banyak dengan mencoba memasukkan ketidakpastian . Apakah justifikasi serupa berlaku untuk parameter beta yang diperkirakan, dan ?
2) Paket apa yang lebih baik (R: gamlss-bb, betareg, aod?; Saya juga memiliki akses ke SAS).
3) Dengan mengestimasi parameter beta, apakah ada jalan pintas (perkiraan) untuk mendapatkan kuantil (2,5%, 97,5%) untuk menghitung keberhasilan di masa depan atau, lebih baik lagi, untuk proporsi keberhasilan di masa mendatang di bawah distribusi Beta-Binomial.