Ketika Anda memasukkan model regresi seperti , model dan penaksir OLS tidak 'tahu' bahwa hanyalah kuadrat dari , itu hanya 'berpikir' itu variabel lain. Tentu saja ada beberapa collinearity, dan yang dimasukkan ke dalam fit (misalnya, kesalahan standar lebih besar daripada yang seharusnya), tetapi banyak pasangan variabel bisa agak collinear tanpa salah satu dari mereka menjadi fungsi dari yang lain. x 2 i xiy^i=β^0+β^1xi+β^2x2ix2ixi
Kami tidak menyadari bahwa sebenarnya ada dua variabel terpisah dalam model, karena kami tahu bahwa pada akhirnya adalah variabel yang sama dengan yang kami transformasikan dan sertakan untuk menangkap hubungan lengkung antara dan . Pengetahuan tentang sifat sebenarnya dari , ditambah dengan keyakinan kami bahwa ada hubungan lengkung antara dan adalah apa yang membuatnya sulit bagi kita untuk memahami cara itu masih linier dari perspektif model. Selain itu, kami memvisualisasikan dan x i x i y i x 2 i x i y i x i x 2 i x , yx2ixixiyix2ixiyixix2ibersama-sama dengan melihat proyeksi marginal dari fungsi 3D ke bidang 2D . x,y
Jika Anda hanya memiliki dan , Anda dapat mencoba memvisualisasikannya dalam ruang 3D penuh (walaupun masih agak sulit untuk benar-benar melihat apa yang sedang terjadi). Jika Anda melihat fungsi pas di ruang 3D penuh, Anda akan melihat bahwa fungsi pas adalah bidang 2D, dan terlebih lagi itu adalah bidang datar. Seperti yang saya katakan, sulit untuk melihat dengan baik karena data hanya ada sepanjang garis lengkung melalui ruang 3D (fakta itu adalah manifestasi visual dari collinearity mereka). Kita dapat mencoba melakukannya di sini. Bayangkan ini adalah model yang pas: x 2 i x i , x 2 ixix2ixi,x2i
x = seq(from=0, to=10, by=.5)
x2 = x**2
y = 3 + x - .05*x2
d.mat = data.frame(X1=x, X2=x2, Y=y)
# 2D plot
plot(x, y, pch=1, ylim=c(0,11), col="red",
main="Marginal projection onto the 2D X,Y plane")
lines(x, y, col="lightblue")
# 3D plot
library(scatterplot3d)
s = scatterplot3d(x=d.mat$X1, y=d.mat$X2, z=d.mat$Y, color="gray", pch=1,
xlab="X1", ylab="X2", zlab="Y", xlim=c(0, 11), ylim=c(0,101),
zlim=c(0, 11), type="h", main="In pseudo-3D space")
s$points(x=d.mat$X1, y=d.mat$X2, z=d.mat$Y, col="red", pch=1)
s$plane3d(Intercept=3, x.coef=1, y.coef=-.05, col="lightblue")
Mungkin lebih mudah untuk melihat dalam gambar-gambar ini, yang merupakan screenshot dari gambar 3D yang dirotasi yang dibuat dengan data yang sama menggunakan rgl
paket.
Ketika kita mengatakan bahwa model yang "linier dalam parameter" benar-benar linier, ini bukan hanya beberapa kecanggihan matematika. Dengan variabel , Anda memasang hipplane dimensi- dalam hiperspace dimensi (dalam contoh kami bidang 2D dalam ruang 3D). Hyperplane itu benar-benar 'datar' / 'linier'; itu bukan hanya metafora. p pppp+1