Apa tes statistik standar untuk melihat apakah data mengikuti distribusi eksponensial atau normal?
Apa tes statistik standar untuk melihat apakah data mengikuti distribusi eksponensial atau normal?
Jawaban:
Tampaknya Anda mencoba memutuskan apakah akan memodelkan data Anda menggunakan distribusi normal atau eksponensial. Ini agak aneh bagi saya, karena distribusi ini sangat berbeda satu sama lain.
Distribusi normal simetris sedangkan distribusi eksponensial sangat condong ke kanan, tanpa nilai negatif. Biasanya sampel dari distribusi eksponensial akan berisi banyak pengamatan yang relatif dekat dengan dan beberapa obervasi yang menyimpang jauh ke kanan dari . Perbedaan ini seringkali mudah dilihat secara grafis.
Berikut adalah contoh di mana saya telah mensimulasikan pengamatan dari distribusi normal dengan rata-rata dan varian dan distribusi eksponensial dengan rata-rata dan varian :
Simetri distribusi normal dan kemiringan eksponensial dapat dilihat dengan menggunakan histogram, boxplots, dan scatterplots, seperti yang diilustrasikan dalam gambar di atas.
Alat lain yang sangat berguna adalah plot-QQ . Dalam contoh di bawah ini, titik-titik harus kira-kira mengikuti garis jika sampel berasal dari distribusi normal. Seperti yang Anda lihat, ini adalah kasus untuk data normal, tetapi tidak untuk data eksponensial.
Jika pemeriksaan grafis untuk beberapa alasan tidak cukup untuk Anda, Anda masih dapat menggunakan tes untuk menentukan apakah distribusi Anda normal atau eksponensial. Karena distribusi normal adalah skala dan lokasi keluarga, Anda akan ingin menggunakan tes yang tidak berubah di bawah perubahan skala dan lokasi (yaitu hasil tes tidak boleh berubah jika Anda mengubah pengukuran Anda dari inci ke sentimeter atau menambahkan untuk semua pengamatan Anda).
Ketika hipotesis nol adalah bahwa distribusi normal dan hipotesis alternatif adalah bahwa itu eksponensial, uji invarian lokasi dan skala yang paling kuat diberikan oleh statistik mana adalah rata-rata sampel, adalah pengamatan terkecil dalam sampel dan adalah standar deviasi sampel. Normalitas ditolak demi eksponensial jika terlalu besar.
Tes ini sebenarnya adalah versi satu sisi dari tes Grubbs untuk pencilan . Anda akan menemukan ini diimplementasikan di sebagian besar perangkat lunak statistik (tetapi pastikan bahwa Anda menggunakan versi yang tepat - ada beberapa statistik uji alternatif yang digunakan untuk tes pencilan!).
Referensi untuk menjadi tes yang paling kuat: Bagian 4.2.4 Pengujian untuk Normalitas oleh HC Thode.
Untuk distribusi eksponensial, Anda dapat menggunakan tes yang disebut tes Moran atau Bartlett. Statistik uji melibatkan rata-rata sampel serta sampel rata-rata dari Di bawah hipotesis nol kita memiliki sekitar dan tes dua sisi bekerja. Tes ini dirancang untuk melawan alternatif gamma. B n ∼ χ 2 ( n - 1 )
Lihat KC Kapur dan LR Lamberson Reliability dalam desain teknik . Wiley 1977.
Untuk normalitas Anderson-Darling dan Shapiro-Wilk dianggap yang terbaik. Untuk tes Lillerfon eksponensial dirancang khusus untuk itu.
Sudahkah Anda mempertimbangkan metode grafis untuk melihat bagaimana data berperilaku?
Teknik grafik probabilitas biasanya melibatkan pemeringkatan data, menerapkan CDF terbalik dan kemudian memplot hasilnya pada bidang Cartesian. Ini memungkinkan Anda untuk melihat apakah beberapa nilai menyimpang dari distribusi yang dihipotesiskan dan mungkin menjelaskan alasan penyimpangan.