Ada (setidaknya) tiga pengertian di mana regresi dapat dianggap "linier." Untuk membedakannya, mari kita mulai dengan model regresi yang sangat umum
Y= f( X, θ , ε ) .
Agar diskusi tetap sederhana, gunakan variabel independen untuk diperbaiki dan diukur secara akurat (bukan variabel acak). Mereka memodelkan pengamatan dari atribut masing-masing, sehingga menimbulkan -vector tanggapan . Secara konvensional, direpresentasikan sebagai matriks dan sebagai kolom vektor. The (terbatas vektor) terdiri dari parameter . adalah variabel acak bernilai vektor. Biasanya memilikin p n Y X n × p Y n q θ ε n f n Y θ εXnhalnYXn×pYnqθεnkomponen, tetapi kadang-kadang memiliki lebih sedikit. Fungsi bernilai vektor (dengan komponen yang cocok dengan ) dan biasanya diasumsikan kontinu dalam dua argumen terakhirnya ( dan ).fnYθε
Contoh pola dasar , dari pemasangan garis ke data, adalah kasus di mana adalah vektor angka - nilai-x; adalah vektor paralel angka ; memberikan intersepsi dan slope ; dan adalah vektor "kesalahan acak" yang komponen-komponennya independen (dan biasanya diasumsikan memiliki distribusi yang sama tetapi tidak diketahui rata-rata nol). Dalam notasi sebelumnya,X ( x i ,(x,y)XY n ( y i ) θ = ( α , β ) α β ε = ( ε 1 , ε 2 , … , ε n )(xi,i=1,2,…,n)Yn(yi)θ=(α,β)αβε=(ε1,ε2,…,εn)
yi=α+βxi+εi=f(X,θ,ε)i
dengan .θ=(α,β)
Fungsi regresi dapat linier dalam salah satu (atau semua) dari tiga argumennya:
"Regresi linier, atau" model linear, "biasanya berarti bahwa adalah linier sebagai fungsi dari parameter . Arti SAS dari" regresi nonlinear " adalah dalam pengertian ini, dengan asumsi tambahan bahwa dapat dibedakan dalam kedua argumen (parameter). Asumsi ini memudahkan untuk menemukan solusi.θ ff θf
A "linear hubungan antara dan " berarti adalah linier sebagai fungsi dari .Y f XXYfX
Model memiliki kesalahan aditif ketika linier di . Dalam kasus seperti itu selalu diasumsikan bahwa . (Kalau tidak, tidak akan benar untuk menganggap sebagai "kesalahan" atau "penyimpangan" dari nilai "benar".)ε E ( ε ) = 0 εfεE(ε)=0ε
Setiap kombinasi yang mungkin dari karakteristik ini dapat terjadi dan bermanfaat. Mari kita survei kemungkinannya.
Model linier dari hubungan linier dengan kesalahan aditif. Ini adalah regresi biasa (berganda), sudah dipamerkan di atas dan lebih umum ditulis sebagai
Y=Xθ+ε.
θ hlmX telah ditambah, jika perlu, dengan berdampingan dengan kolom konstanta, dan adalah vektor- .θp
Model linier dari hubungan nonlinear dengan kesalahan aditif. Ini dapat ditulis sebagai regresi berganda dengan menambah kolom dengan fungsi nonlinear dari itu sendiri. Contohnya,XXX
yi=α+βx2i+ε
adalah dari bentuk ini. Itu linear dalam ; itu memiliki kesalahan aditif; dan itu adalah linear dalam nilai-nilai meskipun adalah fungsi nonlinear dari .( 1 , x 2 i ) x 2 i x iθ=(α,β)(1,x2i)x2ixi
Model linier dari hubungan linier dengan kesalahan yang tidak ditambahkan. Contohnya adalah kesalahan multiplikasi,
yi=(α+βxi)εi.
(Dalam kasus seperti itu dapat diartikan sebagai "kesalahan multiplikasi" ketika lokasi adalah Namun, pengertian lokasi yang tepat tidak harus sesuai dengan harapan lagi: mungkin saja median atau rata-rata geometrik, misalnya. Komentar serupa tentang asumsi lokasi berlaku, mutatis mutandis , dalam semua konteks non-aditif-kesalahan lainnya juga.)ε i 1 E ( ε i )εiεi1E(εi)
Model linear hubungan nonlinear dengan kesalahan yang tidak ditambahkan. misalnya ,
yi=(α+βx2i)εi.
Model nonlinear dari hubungan linier dengan kesalahan aditif. Model nonlinier melibatkan kombinasi parameternya yang tidak hanya nonlinier, mereka bahkan tidak dapat dilinearisasi dengan menyatakan kembali parameter.
Sebagai contoh, pertimbangkan
yi=αβ+β2xi+εi.
α′=αββ′=β2β′≥0
yi=α′+β′xi+εi,
menunjukkannya sebagai model linier (dari hubungan linier dengan kesalahan aditif).
Sebagai contoh, pertimbangkan
yi=α+α2xi+εi.
α′αα′xi
Model nonlinear dari hubungan nonlinear dengan kesalahan aditif.
yi=α+α2x2i+εi.
Model nonlinear dari hubungan linier dengan kesalahan yang tidak ditambahkan.
yi=(α+α2xi)εi.
Model nonlinear dari hubungan nonlinear dengan kesalahan yang tidak ditambahkan.
yi=(α+α2x2i)εi.
Meskipun ini menunjukkan delapan bentuk regresi yang berbeda, mereka tidak membentuk sistem klasifikasi karena beberapa bentuk dapat dikonversi menjadi yang lain. Contoh standar adalah konversi model linear dengan kesalahan yang tidak ditambahkan (diasumsikan memiliki dukungan positif)
yi=(α+βxi)εi
log(yi)=μi+log(α+βxi)+(log(εi)−μi)
μi=E(log(εi))YY
Kolinearitas
XY=f(X,θ,ε)Y=f(X′,θ,ε′)X′X θ^θ^′XθX
Dari sudut pandang ini, harus jelas bahwa kolinearitas merupakan masalah potensial untuk model linier hubungan nonlinear (terlepas dari aditivitas kesalahan) dan bahwa konsep kolinearitas umum ini berpotensi menjadi masalah dalam setiap model regresi. Ketika Anda memiliki variabel berlebihan, Anda akan mengalami masalah mengidentifikasi beberapa parameter.