Jika Anda melakukan ANOVA satu arah untuk menguji apakah ada perbedaan yang signifikan antara kelompok, maka secara implisit Anda membandingkan dua model bersarang (jadi hanya ada satu tingkat bersarang, tetapi masih bersarang).
Kedua model tersebut adalah:
- Model 0: Nilai-nilai (dengan jumlah sampel dan jumlah kelompok) dimodelkan dengan estimasi rata-rata, dari seluruh sampel.
ysaya jijβ^0
yij=β^0+ϵi
Model 1: Nilai-nilai dimodelkan dengan cara perkiraan kelompok.
(dan jika kami mewakili model dengan variasi grup antara,
, maka model 0 bersarang di dalam model 1)βj^
yi=β^0+β^j+ϵi
Contoh membandingkan cara dan ekivalensi dengan model bersarang: mari kita ambil panjang sepal (cm) dari set data iris (jika kita menggunakan keempat variabel kita sebenarnya bisa melakukan LDA atau MANOVA seperti yang dilakukan Fisher pada tahun 1936)
Total yang diamati dan rata-rata kelompok adalah:
μtotalμsetosaμversicolorμvirginica=5.83=5.01=5.94=6.59
Yang ada dalam bentuk model:
model 1: model 2: yij=5.83+ϵiyij=5.01+⎡⎣⎢00.931.58⎤⎦⎥j+ϵi
The dalam model 1 merupakan jumlah total dari kotak .∑ϵ2i=102.1683
The dalam model 2 merupakan dalam kelompok jumlah kuadrat .∑ϵ2i=38.9562
Dan tabel ANOVA akan seperti (dan secara implisit menghitung selisih antara jumlah kelompok kuadrat yang merupakan 63,212 dalam tabel dengan 2 derajat kebebasan):
> model1 <- lm(Sepal.Length ~ 1 + Species, data=iris)
> model0 <- lm(Sepal.Length ~ 1, data=iris)
> anova(model0, model1)
Analysis of Variance Table
Model 1: Sepal.Length ~ 1
Model 2: Sepal.Length ~ 1 + Species
Res.Df RSS Df Sum of Sq F Pr(>F)
1 149 102.168
2 147 38.956 2 63.212 119.26 < 2.2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
dengan
F=RSSdifferenceDFdifferenceRSSnewDFnew=63.212238.956147=119.26
set data yang digunakan dalam contoh:
panjang kelopak (cm) untuk tiga spesies bunga Iris yang berbeda
Iris setosa Iris versicolor Iris virginica
5.1 7.0 6.3
4.9 6.4 5.8
4.7 6.9 7.1
4.6 5.5 6.3
5.0 6.5 6.5
5.4 5.7 7.6
4.6 6.3 4.9
5.0 4.9 7.3
4.4 6.6 6.7
4.9 5.2 7.2
5.4 5.0 6.5
4.8 5.9 6.4
4.8 6.0 6.8
4.3 6.1 5.7
5.8 5.6 5.8
5.7 6.7 6.4
5.4 5.6 6.5
5.1 5.8 7.7
5.7 6.2 7.7
5.1 5.6 6.0
5.4 5.9 6.9
5.1 6.1 5.6
4.6 6.3 7.7
5.1 6.1 6.3
4.8 6.4 6.7
5.0 6.6 7.2
5.0 6.8 6.2
5.2 6.7 6.1
5.2 6.0 6.4
4.7 5.7 7.2
4.8 5.5 7.4
5.4 5.5 7.9
5.2 5.8 6.4
5.5 6.0 6.3
4.9 5.4 6.1
5.0 6.0 7.7
5.5 6.7 6.3
4.9 6.3 6.4
4.4 5.6 6.0
5.1 5.5 6.9
5.0 5.5 6.7
4.5 6.1 6.9
4.4 5.8 5.8
5.0 5.0 6.8
5.1 5.6 6.7
4.8 5.7 6.7
5.1 5.7 6.3
4.6 6.2 6.5
5.3 5.1 6.2
5.0 5.7 5.9
anova()
fungsi R , karena ANOVA pertama, nyata, juga menggunakan uji-F. Ini menyebabkan kebingungan terminologi.