Pertanyaannya adalah tentang efek marginal (X pada Y), saya pikir, tidak begitu banyak tentang menafsirkan koefisien individu. Seperti yang telah dicatat oleh orang, ini kadang-kadang hanya dapat diidentifikasi dengan ukuran efek, misalnya ketika ada hubungan linier dan aditif.
Jika itu fokus maka cara (secara konseptual, jika tidak praktis) yang paling sederhana untuk memikirkan masalah tampaknya adalah sebagai berikut:
Untuk mendapatkan efek marginal X pada Y dalam model regresi normal linier tanpa interaksi, Anda dapat melihat koefisien pada X. Tapi itu tidak cukup karena diperkirakan tidak diketahui. Dalam kasus apa pun, yang benar-benar diinginkan seseorang untuk efek marginal adalah semacam plot atau ringkasan yang memberikan prediksi tentang Y untuk rentang nilai X, dan ukuran ketidakpastian. Biasanya orang mungkin menginginkan rata-rata Y yang diprediksi dan interval kepercayaan, tetapi orang juga mungkin menginginkan prediksi untuk distribusi bersyarat lengkap Y untuk suatu X. Distribusi itu lebih luas daripada estimasi sigma model pas karena memperhitungkan ketidakpastian tentang koefisien model .
Ada berbagai solusi bentuk tertutup untuk model sederhana seperti ini. Untuk tujuan saat ini, kita dapat mengabaikannya dan berpikir secara lebih umum tentang cara mendapatkan grafik efek marginal dengan simulasi, dengan cara yang berhubungan dengan model kompleks yang sewenang-wenang.
Asumsikan Anda menginginkan efek dari berbagai X pada rata-rata Y, dan Anda senang untuk memperbaiki semua variabel lain pada beberapa nilai yang bermakna. Untuk setiap nilai X yang baru, ambil sampel ukuran B dari distribusi koefisien model. Cara mudah untuk melakukannya dalam R adalah dengan mengasumsikan bahwa itu normal dengan mean coef(model)
dan matriks kovarians vcov(model)
. Hitung Y yang diharapkan baru untuk setiap set koefisien dan rangkum lot dengan interval. Kemudian pindah ke nilai X berikutnya.
Tampaknya bagi saya bahwa metode ini seharusnya tidak terpengaruh oleh transformasi mewah apa pun yang diterapkan pada variabel mana pun, asalkan Anda juga menerapkannya (atau kebalikannya) dalam setiap langkah pengambilan sampel. Jadi, jika model yang sesuai memiliki log (X) sebagai prediktor, maka login X baru Anda sebelum mengalikannya dengan koefisien sampel. Jika model yang dipasang memiliki sqrt (Y) sebagai variabel dependen, maka kuadratkan setiap rata-rata yang diprediksi dalam sampel sebelum meringkasnya sebagai interval.
Singkatnya, lebih banyak pemrograman tetapi lebih sedikit perhitungan probabilitas, dan efek marginal yang dapat dipahami secara klinis sebagai hasilnya. 'Metode' ini kadang-kadang disebut CLARIFY dalam literatur ilmu politik, tetapi cukup umum.