Seperti @whuber tanyakan dalam komentar, validasi untuk kategori saya NO. sunting: dengan uji shapiro, karena uji satu sampel ks sebenarnya salah digunakan. Whuber benar: Untuk penggunaan yang benar dari tes Kolmogorov-Smirnov, Anda harus menentukan parameter distribusi dan tidak mengekstraknya dari data. Namun ini adalah apa yang dilakukan dalam paket statistik seperti SPSS untuk uji satu sampel KS.
Anda mencoba mengatakan sesuatu tentang distribusi, dan Anda ingin memeriksa apakah Anda dapat menerapkan uji-t. Jadi tes ini dilakukan untuk mengkonfirmasi bahwa data tidak menyimpang dari normalitas cukup signifikan untuk membuat asumsi yang mendasari analisis tidak valid. Oleh karena itu, Anda tidak tertarik pada kesalahan tipe I, tetapi kesalahan tipe II.
Sekarang kita harus mendefinisikan "sangat berbeda" untuk dapat menghitung minimum n untuk daya yang dapat diterima (katakanlah 0.8). Dengan distribusi, itu tidak mudah untuk didefinisikan. Karenanya, saya tidak menjawab pertanyaan itu, karena saya tidak dapat memberikan jawaban yang masuk akal selain dari aturan praktis yang saya gunakan: n> 15 dan n <50. Berdasarkan apa? Pada dasarnya perasaan Gut, jadi saya tidak bisa mempertahankan pilihan itu selain dari pengalaman.
Tapi saya tahu bahwa dengan hanya 6 nilai kesalahan tipe II Anda pasti hampir 1, membuat kekuatan Anda mendekati 0. Dengan 6 pengamatan, tes Shapiro tidak dapat membedakan antara distribusi normal, poisson, seragam, atau bahkan eksponensial. Dengan kesalahan tipe II hampir 1, hasil tes Anda tidak berarti.
Untuk menggambarkan pengujian normalitas dengan uji shapiro:
shapiro.test(rnorm(6)) # test a the normal distribution
shapiro.test(rpois(6,4)) # test a poisson distribution
shapiro.test(runif(6,1,10)) # test a uniform distribution
shapiro.test(rexp(6,2)) # test a exponential distribution
shapiro.test(rlnorm(6)) # test a log-normal distribution
Satu-satunya di mana sekitar setengah dari nilai lebih kecil dari 0,05, adalah yang terakhir. Yang juga merupakan kasus paling ekstrem.
jika Anda ingin mencari tahu berapa n minimum yang memberi Anda kekuatan yang Anda sukai dengan tes shapiro, orang dapat melakukan simulasi seperti ini:
results <- sapply(5:50,function(i){
p.value <- replicate(100,{
y <- rexp(i,2)
shapiro.test(y)$p.value
})
pow <- sum(p.value < 0.05)/100
c(i,pow)
})
yang memberi Anda analisis kekuatan seperti ini:
dari mana saya menyimpulkan bahwa Anda memerlukan sekitar 20 nilai minimum untuk membedakan eksponensial dari distribusi normal di 80% kasus.
plot kode:
plot(lowess(results[2,]~results[1,],f=1/6),type="l",col="red",
main="Power simulation for exponential distribution",
xlab="n",
ylab="power"
)