Adakah yang bisa memberikan daftar perbedaan yang jelas antara regresi log-linear dan regresi logistik? Saya mengerti yang pertama adalah model regresi linier sederhana tetapi saya tidak jelas kapan masing-masing harus digunakan.
Adakah yang bisa memberikan daftar perbedaan yang jelas antara regresi log-linear dan regresi logistik? Saya mengerti yang pertama adalah model regresi linier sederhana tetapi saya tidak jelas kapan masing-masing harus digunakan.
Jawaban:
Nama itu sedikit keliru. Model log-linear secara tradisional digunakan untuk analisis data dalam format tabel kontingensi. Sementara "data hitung" tidak perlu mengikuti distribusi Poisson, model log-linear sebenarnya hanya model regresi Poisson. Karenanya nama "log" (model regresi Poisson berisi fungsi tautan "log").
"Variabel hasil transformasi log" dalam model regresi linier bukan model log-linear, (tidak juga merupakan variabel hasil eksponensial, seperti yang disarankan "log-linear"). Kedua model log-linear dan regresi logistik adalah contoh dari model linear umum , di mana hubungan antara prediktor linier (seperti log-odds atau log-rates) adalah linear dalam variabel model. Mereka bukan "model regresi linier sederhana" (atau model yang menggunakan format ).
Terlepas dari semua itu, dimungkinkan untuk memperoleh kesimpulan yang setara tentang hubungan antara variabel kategori menggunakan regresi logistik dan regresi poisson. Hanya saja dalam model poisson, variabel hasil diperlakukan seperti kovariat. Menariknya, Anda dapat mengatur beberapa model yang meminjam informasi lintas grup dengan cara yang mirip dengan model odds proporsional, tetapi ini tidak dipahami dengan baik dan jarang digunakan.
Contoh mendapatkan inferensi setara dalam model regresi logistik dan poisson menggunakan R diilustrasikan di bawah ini:
y <- c(0, 1, 0, 1)
x <- c(0, 0, 1, 1)
w <- c(10, 20, 30, 40)
## odds ratio for relationship between x and y from logistic regression
glm(y ~ x, family=binomial, weights=w)
## the odds ratio is the same interaction parameter between contingency table frequencies
glm(w ~ y * x, family=poisson)
Saya tidak berpikir saya akan menyebut salah satu dari mereka "model regresi linier sederhana". Meskipun dimungkinkan untuk menggunakan log atau transformasi logit sebagai fungsi tautan untuk sejumlah model yang berbeda, ini biasanya dipahami untuk merujuk ke model tertentu. Misalnya, "regresi logistik" dipahami sebagai model linier umum (GLiM) untuk situasi di mana variabel respons didistribusikan sebagai binomial . Selain itu, "regresi log-linear" biasanya dipahami sebagai GLMM Poisson yang diterapkan pada tabel kontingensi multi-arah. Dengan kata lain, di luar fakta bahwa keduanya adalah model regresi / GLIM, saya tidak melihat mereka sebagai sangat mirip (ada beberapa koneksi di antara mereka, seperti yang ditunjukkan oleh @AdamO, tetapi penggunaan tipikal cukup berbeda). Perbedaan terbesar adalah bahwa regresi logistik mengasumsikan respons didistribusikan sebagai regresi binomial dan log-linier mengasumsikan respons didistribusikan sebagai Poisson . Faktanya, regresi log-linier agak berbeda dari kebanyakan model regresi karena variabel responsnya tidak benar-benar salah satu dari variabel Anda sama sekali (dalam arti biasa), melainkan kumpulan hitung frekuensi yang terkait dengan kombinasi variabel Anda di tabel kontingensi multi-arah.