Saya melakukan regresi logistik dengan variabel independen dan pengamatan. Saya mengevaluasi kecocokan model untuk menentukan apakah data memenuhi asumsi model dan telah menghasilkan plot sisa binned berikut menggunakan paket:arm
R
Jelas ada beberapa tanda-tanda buruk dalam plot ini: banyak poin berada di luar band kepercayaan dan ada pola yang berbeda dengan residu. Pertanyaan saya adalah - dapatkah saya melampirkan masalah ini pada asumsi spesifik dari model regresi logistik? Sebagai contoh, dapatkah saya mengatakan bahwa ada bukti non-linearitas dalam variabel independen atau heteroskedastisitas? Jika tidak, adakah diagnostik lain yang dapat saya hasilkan untuk membantu mengidentifikasi di mana masalahnya?
Berdasarkan jawaban Daniel, tampaknya masalah utamanya adalah saya menggunakan residu pada skala logit tetapi nilai yang diharapkan pada skala respons. Jika saya mereproduksi plot dengan residu juga pada skala respons, sepertinya ini:
yang jauh lebih bisa dipercaya.