Untuk regresi logistik biner, kasus penggunaan biasa untuk GLM binomial dengan tautan logit, Anda memodelkan probabilitas bahwa variabel dependen Anda adalah "sukses" (atau "ya"), yang secara konvensional diberi kode . Cara Anda melakukan ini adalah dengan memodelkan peluang log. Jadi, daripada memodelkan rata-rata respons seperti pada OLS, Anda memodelkan perubahan dalam peluang log:1
Pr(y=1)=θ=logit−1(β0+β1x1+β2x2+...+β7x7)
Di mana dan .logit(x)=log(x1−x)logit−1(x)=exp(x)1+exp(x)
Penjelasan yang lebih menyeluruh, sangat mudah ditemui tentang hal ini dapat ditemukan di Agresti, Pengantar Analisis Data Kategorikal.
Tetapi untuk pertanyaan khusus Anda, Anda menyatakan bahwa Anda memodelkan proporsi keberhasilan. Ini sebenarnya bukan apa yang dilakukan oleh GLM binomial. Namun, apa yang Anda benar - benar kejar adalah apa yang dilakukan oleh GLM binomial, dan masih mungkin di R. Hanya membutuhkan sedikit penyesuaian terhadap apa yang Anda lakukan. Dalam kasus di mana Anda memiliki jumlah percobaan hingga yang mungkin memiliki keberhasilan , Anda masih dapat menggunakan model yang sama, yang memiliki kepadatan
Karena nilai Anda ditetapkan oleh desain eksperimental, dan adalah keberhasilan yang Anda amati, Anda melakukan inferensi pada parameterny∈{0...n}
Pr(y)∼(ny)θy(1−θ)n−y
nyθ dengan cara yang sama dengan kasus respons biner yang lebih umum (di atas), di mana ditetapkan pada 1, mengambil nilai 1 dengan probabilitas , dan adalah fungsi dari parameter Anda. Untuk kasus tautan logit, maka kami memodelkan , terutama karena transformasi ini ada di seluruh garis nyata, bukan pada interval satuan . (Properti diinginkan lainnya dari tautan logit dijelaskan dalam Agresti, termasuk validitas koefisien bahkan dalam pengaturan di mana sampel nonrandom seperti desain kasus kontrol digunakan; ini bukan kasus untuk, misalnya, fungsi tautan probit.)
nyθθlogit(θ)=β0+β1x1+...+βixi
θ
Dalam hal R, cukup buat objek (yang Anda istilahkan glmDV
) yang merupakan matriks 2-kolom, kolom pertama jumlah keberhasilan dan yang kedua jumlah total kegagalan . Sisa pernyataan itu tetap sama!yn−y
0
s &1
s (yang saya kumpulkan adalah apa yang Anda miliki berdasarkan deskripsi Anda), Anda harus menggunakanweights
argumen w / ? Glm , di mana bobot adalah jumlah total percobaan untuk setiap pengamatan.