Dapatkah saya membuktikan hubungan curvilinear ketika variabel independen linier tidak signifikan

8

Saya sedang menyelidiki efek lengkung antara X dan Y dengan menggunakan analisis regresi hirarkis. Untuk menguji efek lengkung, istilah kuadrat untuk X dihitung (maksud saya pusat juga variabel X).

Dalam model 1, variabel kontrol dimasukkan. Dalam Model 2, X (linear) dimasukkan. Dalam Model 3, X (kuadratik) dimasukkan.

Dalam Model 2, X linear signifikan. Ketika istilah kuadrat dimasukkan dalam Model 3, istilah kuadrat signifikan tetapi istilah linear tidak. Apakah ini membuktikan efek lengkung? Atau apakah penting bahwa dalam Model 3 keduanya (linier dan kuadratik) penting?

Ketika saya tidak bermaksud memusatkan variabel independen, Model 3 menyatakan X linear dan X kuadrat signifikan. Masalahnya di sini adalah masalah multikolinearitas.

regression

— Sanne
sumber

6

Tidak, tidak penting bahwa istilah linear dan kuadrat menjadi signifikan. Hanya istilah kuadratik saja yang signifikan.

Bahkan, penting untuk dicatat bahwa istilah linear mengambil interpretasi yang agak berbeda dalam konteks model yang juga mencakup istilah kuadratik. Dalam model seperti itu, istilah linier sekarang mewakili kemiringan garis tangen ke x pada intersep-y, yaitu kemiringan yang diprediksi x kapan dan hanya ketika x = 0 . Jadi tes istilah linear dalam model seperti ini tidak secara umum menguji hal yang sama seperti dalam model yang hanya menyertakan istilah linear tanpa kuadratik.

— Jake Westfall
sumber

0

Pikirkan tentang apa arti pentingnya. Hubungan bentuk yang Anda sarankan dapat dicirikan sebagai $Y = a_1X^2+a_2X+b$ dan secara empiris diperkirakan sebagai $\hat{Y}=\alpha_1\hat{X}^2+\alpha_2\hat{X}+\beta+\epsilon$ .

Apa arti penting dari perkiraan - katakan, $\alpha_2$ - berarti? Signifikansi adalah Pr (data | H0), dan diberi probabilitas yang "tidak signifikan", apa yang Anda benar-benar tidak tolak, adalah kemungkinan bahwa koefisien mungkin benar-benar nol.

Apakah ini membatalkan asumsi hubungan yang melengkung? Tidak menurut saya. Sebaliknya, tampaknya menyarankan itu $a_2$ benar-benar nol.

Perhatikan contoh berikut (ditulis dalam Stata).

Pertama, kami menghasilkan beberapa data:

set obs 20000
gen x = uniform()
gen control_one = uniform()
gen control_two = uniform()
drawnorm e, m(0) sd(0.5)

Kami kemudian menentukan variabel baru X = x ^ 2 dan hubungan untuk variabel hasil Y

gen Y = control_one+control_two+X+e

(Ini sesuai dengan model lengkung multidimensi dalam x dengan koefisien istilah linier dan konstan sama dengan nol).

Kami kemudian menjalankan beberapa regresi:

reg Y control_one control_two
reg Y control_one control_two x
reg Y control_one control_two X x

Istilah x signifikan dalam model kedua, tetapi tidak pada yang ketiga. Sejauh yang saya mengerti, ini mencerminkan pengalaman Anda dengan data nyata.

— abaumann
sumber

0

Sebenarnya tidak penting bahwa kedua istilah itu penting, tetapi Anda tidak pernah membuktikan apa pun hanya dengan model.

Estimasi koefisien yang diberikan adalah estimasi, dan mereka memberikan bukti. Koefisien besar pada istilah kuadratik menyediakan banyak bukti, koefisien kecil memberikan sedikit bukti, tentang hubungan lengkung. Istilah linear tidak relevan. Itu bisa positif, negatif, mendekati 0 atau apa pun.

Plot data juga akan memberikan bukti hubungan yang melengkung.

Signifikansi statistik berarti hal yang sangat tepat: Jika , dalam populasi dari mana sampel ini diambil, pengaruhnya benar-benar 0, apakah ada kemungkinan 5% bahwa, dalam sampel ukuran yang tersedia, statistik uji sejauh ini atau semakin jauh dari 0 akan didapat.

— Peter Flom
sumber

0

Sebagaimana dicatat, signifikansi istilah lengkung berdiri dengan sendirinya, terlepas dari signifikansi istilah linear dalam regresi. Jika istilah linear mendekati nol, maka kurva adalah U atau U terbalik jika signifikan. Jika kedua istilah tersebut signifikan, garis yang dihasilkan lebih seperti bukit dengan kemiringan yang mempercepat (atau melambat).

— StatistikDoc Konsultasi
sumber