Saya sedang melakukan regresi logistik dengan hasil biner (mulai dan tidak mulai). Campuran prediktor saya semuanya adalah variabel kontinu atau dikotomis.
Menggunakan pendekatan Box-Tidwell, salah satu prediktor kontinu saya berpotensi melanggar asumsi linearitas logit. Tidak ada indikasi dari statistik good-of-fit yang cocok bermasalah.
Saya kemudian menjalankan model regresi lagi, menggantikan variabel kontinu asli dengan: pertama, transformasi akar kuadrat dan kedua, versi dikotomis dari variabel.
Pada inspeksi output, tampaknya good-of-fit membaik secara marginal tetapi residu menjadi bermasalah. Estimasi parameter, kesalahan standar, dan tetap relatif sama. Interpretasi data tidak berubah dalam hal hipotesis saya, di ketiga model.
Oleh karena itu, dalam hal kegunaan hasil saya dan rasa interpretasi data, tampaknya tepat untuk melaporkan model regresi menggunakan variabel kontinu asli.
Saya bertanya-tanya ini:
- Kapan regresi logistik kuat terhadap potensi pelanggaran linearitas asumsi logit?
- Dengan contoh saya di atas, apakah masuk akal untuk memasukkan variabel kontinu asli dalam model?
- Apakah ada referensi atau panduan di luar sana untuk merekomendasikan ketika memuaskan untuk menerima bahwa model tersebut kuat terhadap potensi pelanggaran linearitas logit?