Istilah interaksi dan polinomial berurutan lebih tinggi


13

Jika saya tertarik untuk menyesuaikan interaksi dua arah antara variabel penjelas linier dan variabel penjelas lain yang memiliki hubungan kuadratik dengan variabel dependen , apakah saya harus memasukkan interaksi dengan komponen kuadratik dan interaksi dengan linier komponen dalam model? Misalnya: Pada gilirannya membangun di utas saya sebelumnya: Istilah kelengkungan dan pemilihan model , jika ini adalah analisis pemilihan model menggunakan dalam R, dengan banyak variabel penjelas, akankah model yang dikeluarkan berisi istilah interaksi yang mencakup istilah kuadratSebuahby

ySebuah+b+b2+Sebuahb+Sebuahb2
MuMInSebuah:b2hanya valid jika istilah interaksi dengan komponen linear juga hadir dalam model yang sama, serta , dan sebagai efek langsung?Sebuah:bSebuahbb2

Jawaban:


13

Ya, Anda harus selalu memasukkan semua istilah, dari urutan tertinggi hingga istilah linear, dalam interaksi. Ada beberapa utas yang sangat hebat tentang CV yang membahas masalah terkait yang mungkin berguna untuk Anda pikirkan:

Jawaban singkatnya adalah bahwa dengan tidak termasuk istilah tertentu dalam model, Anda memaksa bagian-bagian itu menjadi persis nol. Ini memaksakan kaku untuk model Anda yang tentu menyebabkan bias kecuali parameter yang persis nol dalam realitas ; situasinya analog dengan menekan intersep (yang dapat Anda lihat dibahas di sini ).

Anda juga harus menyadari bahwa setiap rutin pemilihan model otomatis berbahaya. (Untuk cerita dasar, mungkin akan membantu untuk membaca jawaban saya di sini .) Selain itu, bagaimanapun, algoritma ini tidak 'berpikir' dalam hal hubungan antara variabel, sehingga mereka tidak harus menjaga istilah level yang lebih rendah dalam model ketika istilah daya atau interaksi dimasukkan.

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.