Saya menyesuaikan regresi logistik bertahap pada satu set data di SPSS. Dalam prosedur, saya menyesuaikan model saya ke subset acak yang kira-kira. 60% dari total sampel, yaitu sekitar 330 kasus.
Apa yang saya temukan menarik adalah bahwa setiap kali saya sampel ulang data saya, saya mendapatkan variabel yang berbeda muncul dan keluar dalam model akhir. Beberapa prediktor selalu hadir dalam model akhir, tetapi yang lain muncul dan keluar tergantung pada sampel.
Pertanyaan saya adalah ini. Apa cara terbaik untuk menangani ini? Saya berharap untuk melihat konvergensi variabel prediktor, tetapi bukan itu masalahnya. Beberapa model masuk akal jauh lebih intuitif dari pandangan operasional (dan akan lebih mudah untuk dijelaskan kepada para pembuat keputusan), dan yang lain sesuai dengan data sedikit lebih baik.
Singkatnya, karena ada variabel yang bergerak ke sana kemari, bagaimana Anda akan merekomendasikan berurusan dengan situasi saya?
Banyak terima kasih sebelumnya.