Dalam menjawab pertanyaan ini John Christie menyarankan agar kecocokan model regresi logistik harus dinilai dengan mengevaluasi residu. Saya akrab dengan cara menafsirkan residu dalam OLS, mereka berada dalam skala yang sama dengan DV dan sangat jelas perbedaan antara y dan y yang diprediksi oleh model. Namun untuk regresi logistik, di masa lalu saya biasanya hanya memeriksa perkiraan kecocokan model, misalnya AIC, karena saya tidak yakin apa artinya residu untuk regresi logistik. Setelah melihat ke dalam file bantuan R sedikit saya melihat bahwa di R ada lima jenis residu glm yang tersedia c("deviance", "pearson", "working","response", "partial")
,. File bantuan merujuk ke:
- Davison, AC dan Snell, EJ (1991) Residual dan diagnostik. Dalam: Teori dan Pemodelan Statistik. Untuk Kehormatan Sir David Cox, FRS , eds. Hinkley, DV, Reid, N. dan Snell, EJ, Chapman & Hall.
Saya tidak punya salinannya. Apakah ada cara singkat untuk menggambarkan cara menafsirkan masing-masing jenis ini? Dalam konteks logistik akankah jumlah residu kuadrat memberikan ukuran yang sesuai dari model yang cocok atau lebih baik dengan Kriteria Informasi?
binnedplot
fungsi di lengan paket R memberikan plot residu yang sangat membantu. Ini dijelaskan dengan baik pada hal.97-101 dari Gelman dan Hill 2007 .