Saya mencoba memahami konsep overdispersion dalam regresi logistik. Saya telah membaca bahwa penyebaran berlebihan adalah ketika varians yang diamati dari variabel respon lebih besar daripada yang diharapkan dari distribusi binomial.
Tetapi jika variabel binomial hanya dapat memiliki dua nilai (1/0), bagaimana bisa memiliki mean dan varians?
Saya baik-baik saja dengan menghitung rata-rata dan ragam keberhasilan dari x jumlah uji coba Bernoulli. Tapi saya tidak bisa membungkus kepala saya di sekitar konsep mean dan varians dari variabel yang hanya dapat memiliki dua nilai.
Adakah yang bisa memberikan gambaran intuitif tentang:
- Konsep mean dan varians dalam variabel yang hanya dapat memiliki dua nilai
- Konsep overdispersion dalam suatu variabel yang hanya dapat memiliki dua nilai