Jawaban di atas lebih intuitif, jadi saya mencoba lebih keras.
Apa itu GLM?
Misalkan menunjukkan sekumpulan respons y dan p -dimensi kovariat vektor x = ( x 1 , ... , x p ) dengan nilai yang diharapkan E ( y ) = μ . Untuk i = 1 , ... , n pengamatan independen, distribusi setiap y i adalah keluarga eksponensial dengan kepadatan
f ( y i ;Y= ( y, x )yhalx =( x1, ... , xhal)E(y)=μi=1,…,nyi
Di sini, parameter yang menarik (parameter alami atau kanonik) adalah θ i , ϕ adalah a parameter skala (dikenal atau dilihat sebagai gangguan) dan γ dan τ adalah fungsi yang diketahui. The n vektor berdimensi nilai input tetap untuk p
f(yi;θi,ϕ)=exp{[yiθi−γ(θi)]/ϕ+τ(yi,ϕ)}
θiϕγτnpvariabel penjelas dilambangkan dengan
. Kami berasumsi bahwa vektor input mempengaruhi (1) hanya melalui fungsi linier, prediktor linier,
η i = β 0 + β 1 x i 1 + ⋯ + β p x i p
di mana
θ i bergantung. Seperti dapat ditunjukkan bahwa
θ = ( γ ′ ) - 1 ( μ )x1,…,xpηi=β0+β1xi1+⋯+βpxip
θiθ=(γ′)−1(μ), ketergantungan ini ditetapkan dengan menghubungkan prediktor linier
dan
θ melalui mean. Lebih khusus, rata-rata
μ dilihat sebagai fungsi yang dapat dibalik dan mulus dari prediktor linier, yaitu
g ( μ ) = η atau μ = g - 1 ( η )
Sekarang untuk menjawab pertanyaan Anda:
ηθμg(μ)=η or μ=g−1(η)
g(⋅)μηθη≡θg=(γ′)−1
X′y∑ixijyij=1,…,pμ
Oleh karena itu mereka cenderung digunakan secara default. Namun perlu dicatat, bahwa tidak ada alasan apriori mengapa efek dalam model harus aditif pada skala yang diberikan oleh tautan ini atau lainnya.