Saya terutama akan fokus pada tiga pertanyaan pertama Anda. Jawaban singkatnya adalah: (1) Anda perlu membandingkan efek IV pada DV untuk setiap periode waktu tetapi (2) hanya membandingkan besaran dapat menyebabkan kesimpulan yang salah, dan (3) ada banyak cara untuk melakukan itu tetapi tidak ada konsensus yang mana yang benar.
Di bawah ini saya jelaskan mengapa Anda tidak bisa hanya membandingkan besaran koefisien dan mengarahkan Anda ke beberapa solusi yang telah dipikirkan sejauh ini.
Menurut Allison (1999), tidak seperti OLS, koefisien regresi logistik dipengaruhi oleh heterogenitas yang tidak teramati bahkan ketika heterogenitas seperti itu tidak terkait dengan variabel minat.
Ketika Anda cocok dengan regresi logistik seperti:
(1)
dalam( 11 - halsaya) =β0+ β1x1 i
y∗1y∗
y∗= α0+ α1x1 i+ σε
ε
αβ
βj= αjσj = 1 , . . . , J.
σβσ
Ini karena perbandingan dapat menghasilkan kesimpulan yang salah jika variasi yang tidak teramati berbeda antar kelompok, negara atau periode. Kedua perbandingan menggunakan model yang berbeda dan menggunakan istilah interaksi dalam model yang sama menderita masalah ini. Selain logit, ini juga berlaku untuk probit sepupunya, clog-log, cauchit dan, dengan ekstensi, untuk model bahaya waktu diskrit yang diperkirakan menggunakan fungsi tautan ini. Model logit yang dipesan juga terpengaruh olehnya.
Williams (2009) berpendapat bahwa solusinya adalah memodelkan variasi yang tidak teramati melalui model pilihan heterogen (alias, model skala lokasi), dan memberikan tambahan Stata pada panggilan oglm
untuk itu (Williams 2010). Dalam R, model pilihan yang heterogen dapat disesuaikan dengan hetglm()
fungsi glmx
paket, yang tersedia melalui CRAN. Kedua program ini sangat mudah digunakan. Terakhir, Williams (2009) menyebutkan PLUM
rutinitas SPSS untuk pemasangan model-model ini, tetapi saya belum pernah menggunakannya dan tidak dapat berkomentar betapa mudahnya menggunakannya.
Namun, setidaknya ada satu kertas kerja di luar sana yang menunjukkan bahwa perbandingan menggunakan model pilihan yang heterogen bahkan bisa lebih bias jika persamaan varians salah ditentukan atau ada kesalahan pengukuran.
Mood (2010) daftar solusi lain yang tidak melibatkan pemodelan varians, tetapi menggunakan perbandingan perubahan probabilitas yang diprediksi.
Rupanya itu adalah masalah yang tidak diselesaikan dan saya sering melihat makalah di konferensi bidang saya (Sosiologi) datang dengan solusi yang berbeda untuk itu. Saya akan menyarankan Anda untuk melihat apa yang dilakukan orang di bidang Anda dan kemudian memutuskan bagaimana menghadapinya.
Referensi
- Allison, PD (1999). Membandingkan Koefisien Logit dan Probit di Seluruh Grup. Metode & Penelitian Sosiologis, 28 (2), 186-208.
- Mood, C. (2010). Regresi Logistik: Mengapa Kita Tidak Dapat Melakukan Apa yang Kita Pikirkan Kita Dapat Kita Lakukan, dan Apa yang Dapat Kita Lakukan Tentang Itu. European Sociological Review, 26 (1), 67–82.
- Williams, R. (2009). Menggunakan Model Pilihan Heterogen untuk Membandingkan Logit dan Koefisien Probit di Seluruh Grup. Metode & Penelitian Sosiologis, 37 (4), 531–559.
- Williams, R. (2010). Menyesuaikan model pilihan heterogen dengan oglm. The Stata Journal, 10 (4), 540–567.