Asumsikan situasi berikut:
kami memiliki sejumlah besar (misalnya 20) dengan ukuran kelompok kecil (misalnya n = 3). Saya perhatikan bahwa jika saya menghasilkan nilai dari distribusi seragam, residu akan terlihat normal meskipun distribusi kesalahan seragam. Kode R berikut menunjukkan perilaku ini:
n.group = 200
n.per.group = 3
x <- runif(n.group * n.per.group)
gr <- as.factor(rep(1:n.group, each = n.per.group))
means <- tapply(x, gr, mean)
x.res <- x - means[gr]
hist(x.res)
Jika saya melihat sisa sampel dalam kelompok tiga, alasan perilaku jelas:
Karena adalah jumlah variabel acak dengan standar deviasi yang tidak berbeda, distribusinya sedikit lebih dekat dengan distribusi normal daripada ketentuan individual.
Sekarang anggap saya memiliki situasi yang sama dengan data nyata, bukan data simulasi. Saya ingin menilai apakah asumsi ANOVA mengenai normalitas berlaku. Prosedur yang paling direkomendasikan merekomendasikan inspeksi visual residu (misalnya QQ-Plot) atau tes normalitas pada residu. Seperti contoh saya di atas ini tidak benar-benar optimal untuk ukuran kelompok kecil.
Apakah ada alternatif yang lebih baik ketika saya memiliki banyak kelompok ukuran kecil?