Model linear umum memungkinkan kita menulis model ANOVA sebagai model regresi. Mari kita asumsikan kita memiliki dua kelompok dengan masing-masing dua pengamatan, yaitu, empat pengamatan dalam vektor . Kemudian model orisinil, overparametrized adalah , di mana adalah matriks prediktor, yaitu variabel indikator kode-dummy:
E ( y ) = X ⋆ β ⋆ X ⋆ ( μ 1 μ 1 μ 2 μ 2 ) = ( 1 1 0 1 1 0 1 0 1 0 1 1 0 1 ) ( β ⋆ 0 β ⋆ 1 β ⋆ 2 )yE(y)=X⋆β⋆X⋆
⎛⎝⎜⎜⎜μ1μ1μ2μ2⎞⎠⎟⎟⎟=⎛⎝⎜⎜⎜111111000011⎞⎠⎟⎟⎟⎛⎝⎜β⋆0β⋆1β⋆2⎞⎠⎟
Parameter tidak dapat diidentifikasi sebagai karena memiliki peringkat 2 ( tidak dapat dibalik). Untuk mengubahnya, kami memperkenalkan batasan (kontras pengobatan), yang memberi kami model baru :
X ⋆ ( X ⋆ ) ′ X ⋆ β ⋆ 1 = 0 E ( y ) = X β ( μ 1 μ 1 μ 2 μ 2 2 ) = ( 1 0 1 0 1 1 1 1((X⋆)′X⋆)−1(X⋆)′E(y)X⋆(X⋆)′X⋆β⋆1=0E(y)=Xβ
⎛⎝⎜⎜⎜μ1μ1μ2μ2⎞⎠⎟⎟⎟=⎛⎝⎜⎜⎜11110011⎞⎠⎟⎟⎟(β0β2)
Jadi , yaitu, mengambil arti dari nilai yang diharapkan dari kategori referensi kami (grup 1). , yaitu, mengambil arti perbedaan untuk kategori referensi. Karena dengan dua kelompok, hanya ada satu parameter yang terkait dengan efek kelompok, hipotesis nol ANOVA (semua parameter efek kelompok adalah 0) sama dengan bobot regresi, hipotesis nol (parameter kemiringan adalah 0). β 0 μ 2 = β 0 + β 2 β 2 μ 2 - μ 1μ1=β0β0μ2=β0+β2β2μ2−μ1
Uji - dalam model linier umum menguji kombinasi linear dari parameter terhadap nilai hipotesis bawah hipotesis nol. Memilih , dengan demikian kita dapat menguji hipotesis bahwa (tes biasa untuk parameter slope), yaitu di sini, . Estimatornya adalah , di mana adalah Estimasi OLS untuk parameter. Statistik uji umum untuk adalah:
tψ=∑cjβjψ0c=(0,1)′β2=0μ2−μ1=0ψ^=∑cjβ^jβ^=(X′X)−1X′yψ
t=ψ^−ψ0σ^c′(X′X)−1c−−−−−−−−−√
σ^2=∥e∥2/(n−Rank(X)) adalah estimator yang tidak bias untuk varian kesalahan, di mana adalah jumlah dari residu kuadrat. Dalam kasus dua grup , , dan estimatornya adalah dan . Dengan menjadi 1 dalam kasus kami, statistik pengujian menjadi:
∥e∥2Rank(X)=2(X′X)−1X′=(.5−.5.5−.50.50.5)β^0=0.5y1+0.5y2=M1β^2=−0.5y1−0.5y2+0.5y3+0.5y4=M2−M1c′(X′X)−1c
t=M2−M1−0σ^=M2−M1∥e∥2/(n−2)−−−−−−−−−−√
t yaitu -distributed dengan df (disini ). Saat Anda kuadrat , Anda mendapatkan , statistik uji dari ANOVA -test untuk dua kelompok ( untuk antara, untuk dalam kelompok) yang mengikuti - distribusi dengan 1 dan df.tn−Rank(X)n−2tFbwFn-Rank(X)(M2−M1)2/1∥e∥2/(n−2)=SSb/dfbSSw/dfw=FFbwFn−Rank(X)
Dengan lebih dari dua kelompok, hipotesis ANOVA (semua secara bersamaan 0, dengan ) mengacu pada lebih dari satu parameter dan tidak dapat dinyatakan sebagai kombinasi linear , sehingga pengujian tidak setara. . 1 ≤ j ψβj1≤jψ