Ini adalah pertanyaan mengenai praktik atau metode yang diikuti oleh beberapa rekan saya. Saat membuat model regresi logistik, saya telah melihat orang-orang mengganti variabel kategori (atau variabel kontinu yang dihilangkan) dengan masing-masing Bobot Bukti (WoE) masing-masing. Ini seharusnya dilakukan untuk membangun hubungan monoton antara regressor dan variabel dependen. Sekarang sejauh yang saya mengerti, setelah model dibuat, variabel dalam persamaan BUKAN variabel dalam dataset. Alih-alih, variabel-variabel dalam persamaan sekarang menjadi semacam kepentingan atau bobot variabel dalam memilah variabel dependen !
Pertanyaan saya adalah: bagaimana kita sekarang menafsirkan model atau koefisien model? Misalnya untuk persamaan berikut:
kita dapat mengatakan bahwa adalah peningkatan relatif dalam rasio odd untuk 1 peningkatan unit dalam variabel .x 1
Tetapi jika variabel digantikan oleh WoE-nya, maka interpretasinya akan diubah menjadi: peningkatan relatif dalam rasio ganjil untuk 1 unit peningkatan IMPORANCE / WEIGHT dari variabel
Saya telah melihat praktik ini di internet, tetapi tidak menemukan jawaban untuk pertanyaan ini. Tautan dari komunitas ini sendiri terkait dengan permintaan yang agak mirip tempat seseorang menulis:
WoE menampilkan hubungan linear dengan logaritma natural dari rasio odds yang merupakan variabel dependen dalam regresi logistik. Oleh karena itu, pertanyaan tentang kesalahan spesifikasi model tidak muncul dalam regresi logistik ketika kita menggunakan WoE alih-alih nilai aktual dari variabel.
Tapi saya masih belum mendapatkan penjelasannya. Tolong bantu saya memahami apa yang saya lewatkan.