Kurtosis mengukur outlier. Pencilan adalah masalah untuk kesimpulan standar (misalnya, uji-t, interval-t) yang didasarkan pada distribusi normal. Itulah akhir dari cerita! Dan itu benar-benar cerita yang sangat sederhana.
Alasan mengapa kisah ini tidak dihargai adalah karena mitos kuno bahwa kurtosis mengukur "puncaknya" masih ada.
Berikut adalah penjelasan sederhana yang menunjukkan mengapa kurtosis mengukur outlier dan bukan "peakedness".
Pertimbangkan kumpulan data berikut.
0, 3, 4, 1, 2, 3, 0, 2, 1, 3, 2, 0, 2, 2, 3, 2, 5, 2, 3, 1
Kurtosis adalah nilai yang diharapkan dari (nilai-z) ^ 4. Inilah (nilai-z) ^ 4:
6.51, 0.30, 5.33, 0.45, 0.00, 0.30, 6.51, 0.00, 0.45, 0.30, 0.00, 6.51, 0.00, 0.00, 0.30, 0.00, 27.90, 0.00, 0.30, 0.45
Rata-rata adalah 2,78, dan itu adalah perkiraan kurtosis. (Kurangi 3 jika Anda menginginkan kelebihan kurtosis.)
Sekarang, ganti nilai data terakhir dengan 999 sehingga menjadi pencilan:
0, 3, 4, 1, 2, 3, 0, 2, 1, 3, 2, 0, 2, 2, 3, 2, 5, 2, 3, 999
Sekarang, inilah (nilai-z) ^ 4:
0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00,0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 360,98
Rata-rata adalah 18,05, dan itu adalah perkiraan kurtosis. (Kurangi 3 jika Anda menginginkan kelebihan kurtosis.)
Jelas, hanya pencilan yang berpengaruh. Tidak ada tentang "puncak" atau data di dekat hal-hal tengah.
Jika Anda melakukan analisis statistik standar dengan kumpulan data kedua, Anda akan mengalami masalah. Kurtosis besar memberi tahu Anda tentang masalahnya.
Berikut ini makalah yang menguraikan:
Westfall, PH (2014). Kurtosis as Peakedness, 1905 - 2014. RIP The American Statistician, 68, 191–195.