Apa perbedaan antara uji normalitas Shapiro-Wilk dan uji normalitas Kolmogorov-Smirnov? Kapan hasil dari kedua metode ini berbeda?
Apa perbedaan antara uji normalitas Shapiro-Wilk dan uji normalitas Kolmogorov-Smirnov? Kapan hasil dari kedua metode ini berbeda?
Jawaban:
Anda bahkan tidak dapat membandingkan keduanya karena Kolmogorov-Smirnov adalah untuk distribusi yang ditentukan secara lengkap (jadi jika Anda menguji normalitas, Anda harus menentukan rata-rata dan varians; mereka tidak dapat diperkirakan dari data *), sementara Shapiro-Wilk adalah untuk normalitas, dengan mean dan varian yang tidak ditentukan.
* Anda juga tidak dapat melakukan standarisasi dengan menggunakan estimasi parameter dan menguji normal normal; itu sebenarnya hal yang sama.
Salah satu cara untuk membandingkan akan melengkapi Shapiro-Wilk dengan tes untuk rata-rata yang ditentukan dan varians dalam normal (menggabungkan tes dalam beberapa cara), atau dengan memiliki tabel KS disesuaikan untuk estimasi parameter (tapi kemudian tidak lagi distribusi -bebas).
Ada tes seperti itu (setara dengan Kolmogorov-Smirnov dengan perkiraan parameter) - tes Lilliefors; versi uji normalitas dapat secara valid dibandingkan dengan Shapiro-Wilk (dan umumnya akan memiliki daya yang lebih rendah). Yang lebih kompetitif adalah uji Anderson-Darling (yang juga harus disesuaikan untuk estimasi parameter agar perbandingan menjadi valid).
Adapun apa yang mereka uji - tes KS (dan Lilliefors) melihat perbedaan terbesar antara CDF empiris dan distribusi yang ditentukan, sedangkan Shapiro Wilk secara efektif membandingkan dua perkiraan varian; Shapiro-Francia yang terkait erat dapat dianggap sebagai fungsi monotonik dari korelasi kuadrat dalam plot QQ; jika saya ingat dengan benar, Shapiro-Wilk juga memperhitungkan kovarian antara statistik pesanan.
Diedit untuk menambahkan: Sementara Shapiro-Wilk hampir selalu mengalahkan tes Lilliefors pada alternatif yang menarik, contoh di mana itu tidak dalam sampel menengah-besar ( -ish). Di sana para Lilliefors memiliki kekuatan yang lebih tinggi.
[Harus diingat bahwa ada lebih banyak tes untuk normalitas yang tersedia daripada ini.]
hist(replicate(1000,ks.test(scale(rnorm(x)),pnorm)$p.value))
- jika nilai-p seperti yang seharusnya, itu akan terlihat seragam!
Secara singkat dinyatakan, uji Shapiro-Wilk adalah tes khusus untuk normalitas, sedangkan metode yang digunakan oleh uji Kolmogorov-Smirnov lebih umum, tetapi kurang kuat (artinya lebih sering menolak hipotesis nol tentang normalitas). Kedua statistik mengambil normalitas sebagai nol dan menetapkan statistik uji berdasarkan sampel, tetapi bagaimana mereka melakukannya berbeda satu sama lain dengan cara yang membuat mereka lebih atau kurang peka terhadap fitur distribusi normal.
Bagaimana tepatnya W (statistik uji untuk Shapiro-Wilk) dihitung agak terlibat , tetapi secara konseptual, itu melibatkan menyusun nilai-nilai sampel dengan ukuran dan mengukur kesesuaian terhadap rata-rata yang diharapkan, varian dan kovariansi. Beberapa perbandingan ini terhadap normalitas, seperti yang saya pahami, memberikan tes lebih banyak kekuatan daripada tes Kolmogorov-Smirnov, yang merupakan salah satu cara di mana mereka mungkin berbeda.
Sebaliknya, uji Kolmogorov-Smirnov untuk normalitas berasal dari pendekatan umum untuk menilai goodness of fit dengan membandingkan distribusi kumulatif yang diharapkan dengan distribusi kumulatif empiris, vis:
Karena itu, ia sensitif di pusat distribusi, dan bukan bagian ekor. Namun, KS adalah tes yang konvergen, dalam arti bahwa karena n cenderung tak terhingga, tes menyatu dengan jawaban yang benar dalam probabilitas (saya percaya bahwa Teorema Glivenko-Cantelli berlaku di sini, tetapi seseorang dapat mengoreksi saya). Ini adalah dua cara lagi di mana kedua tes ini mungkin berbeda dalam evaluasi normalitasnya.