Uji rasio kemungkinan (alias penyimpangan) dan uji ketidakcocokan (atau good-of-fit) cukup mudah untuk mendapatkan model regresi logistik (cocok menggunakan glm(..., family = binomial)
fungsi) dalam R. Namun, bisa mudah untuk memiliki jumlah sel berakhir cukup rendah sehingga tes tidak dapat diandalkan. Salah satu cara untuk memverifikasi keandalan uji rasio kemungkinan untuk kurangnya kesesuaian adalah dengan membandingkan statistik uji dan nilai- P dengan yang ada pada uji chi square Pearson (atau ).
Baik glm
objek maupun summary()
metodenya melaporkan statistik uji untuk uji chi square Pearson karena kurang fit. Dalam pencarian saya, satu-satunya hal yang saya temukan adalah chisq.test()
fungsi (dalam stats
paket): dokumentasinya mengatakan " chisq.test
melakukan tes tabel kontingensi chi-squared dan tes good-of-fit." Namun, jarang ada dokumentasi tentang cara melakukan tes tersebut:
Jika
x
merupakan matriks dengan satu baris atau kolom, atau jikax
merupakan vektor dany
tidak diberikan, maka dilakukan uji good-of-fit (x
diperlakukan sebagai tabel kontingensi satu dimensi). Entri darix
harus bilangan bulat non-negatif. Dalam hal ini, hipotesis yang diuji adalah apakah probabilitas populasi sama denganp
, atau semuanya sama jikap
tidak diberikan.
Saya akan membayangkan bahwa Anda dapat menggunakan y
komponen glm
objek untuk x
argumen chisq.test
. Namun, Anda tidak dapat menggunakan fitted.values
komponen glm
objek untuk p
argumen chisq.test
, karena Anda akan mendapatkan kesalahan: " probabilities must sum to 1.
"