Daripada mengandalkan tes normalitas residu, cobalah menilai normalitas dengan penilaian rasional. Tes normalitas tidak memberi tahu Anda bahwa data Anda normal, hanya saja tidak. Tetapi mengingat bahwa data tersebut adalah sampel, Anda dapat yakin bahwa mereka sebenarnya tidak normal tanpa tes. Persyaratannya kira-kira normal. Tes tidak bisa mengatakan itu kepada Anda. Tes juga menjadi sangat sensitif pada N besar atau lebih serius, bervariasi dalam kepekaan dengan N. N Anda berada dalam kisaran di mana sensitivitas mulai semakin tinggi. Jika Anda menjalankan simulasi berikut dalam R beberapa kali dan melihat plot maka Anda akan melihat bahwa tes normalitas mengatakan "tidak normal" pada sejumlah distribusi normal yang baik.
# set the plot area to show two plots side by side (make the window wide)
par(mfrow = c(1, 2))
n <- 158 # use the N we're concerned about
# Run this a few times to get an idea of what data from a
# normal distribution should look like.
# especially note how variable the histograms look
y <- rnorm(n) # n numbers from normal distribution
# view the distribution
hist(y)
qqnorm(y);qqline(y)
# run this section several times to get an idea what data from a normal
# distribution that fails the normality test looks like
# the following code block generates random normal distributions until one
# fails a normality test
p <- 1 # set p to a dummy value to start with
while(p >= 0.05) {
y <- rnorm(n)
p <- shapiro.test(y)$p.value }
# view the distribution that failed
hist(y)
qqnorm(y);qqline(y)
Mudah-mudahan, setelah melalui simulasi Anda dapat melihat bahwa tes normalitas dapat dengan mudah menolak data yang tampak cukup normal dan bahwa data dari distribusi normal dapat terlihat cukup jauh dari normal. Jika Anda ingin melihat nilai ekstrem dari percobaan itun <- 1000
. Distribusi semua akan terlihat normal tetapi masih gagal tes pada tingkat yang sama dengan nilai N yang lebih rendah. Dan sebaliknya, dengan distribusi N rendah yang lulus tes bisa terlihat sangat jauh dari normal.
Plot residual standar dalam SPSS tidak terlalu berguna untuk menilai normalitas. Anda dapat melihat outlier, kisaran, kebaikan, dan bahkan mungkin pengaruh. Tetapi normalitas sulit didapat darinya. Cobalah simulasi berikut yang membandingkan histogram, plot normal kuantil-kuantil, dan plot residual.
par(mfrow = c(1, 3)) # making 3 graphs in a row now
y <- rnorm(n)
hist(y)
qqnorm(y); qqline(y)
plot(y); abline(h = 0)
Sangat sulit untuk mengatakan normalitas, atau banyak hal, dari plot terakhir dan karenanya tidak terlalu diagnostik normalitas.
Singkatnya, umumnya disarankan untuk tidak bergantung pada tes normalitas melainkan plot diagnostik residu. Tanpa plot atau nilai aktual dalam pertanyaan Anda, sangat sulit bagi siapa pun untuk memberikan saran yang solid tentang apa yang dibutuhkan data Anda dalam hal analisis atau transformasi. Untuk mendapatkan bantuan terbaik, berikan data mentah.