Seperti tes parametrik lainnya, analisis varian mengasumsikan bahwa data sesuai dengan distribusi normal. Jika variabel pengukuran Anda tidak terdistribusi secara normal, Anda mungkin meningkatkan peluang hasil positif palsu jika Anda menganalisis data dengan anova atau tes lain yang mengasumsikan normalitas. Untungnya, anova tidak terlalu sensitif terhadap penyimpangan moderat dari normalitas; studi simulasi, menggunakan berbagai distribusi non-normal, telah menunjukkan bahwa tingkat positif palsu tidak banyak dipengaruhi oleh pelanggaran asumsi ini (Glass et al. 1972, Harwell et al. 1992, Lix et al. 1996). Ini karena ketika Anda mengambil sejumlah besar sampel acak dari suatu populasi, rata-rata sampel tersebut terdistribusi secara normal bahkan ketika populasinya tidak normal.
Dimungkinkan untuk menguji good-of-fit dari suatu set data dengan distribusi normal. Saya tidak menyarankan Anda melakukan ini, karena banyak set data yang secara signifikan tidak normal akan sangat cocok untuk anova.
Sebaliknya, jika Anda memiliki kumpulan data yang cukup besar, saya sarankan Anda hanya melihat histogram frekuensi. Jika terlihat lebih atau kurang normal, silakan dan lakukan anova. Jika terlihat seperti distribusi normal yang didorong ke satu sisi, seperti data sulfat di atas, Anda harus mencoba transformasi data yang berbeda dan melihat apakah ada di antaranya yang membuat histogram terlihat lebih normal. Jika itu tidak berhasil, dan data masih terlihat sangat tidak normal, mungkin masih oke untuk menganalisis data menggunakan anova. Namun, Anda mungkin ingin menganalisisnya menggunakan tes non-parametrik. Hampir setiap uji statistik parametrik memiliki pengganti non-parametrik, seperti uji Kruskal-Wallis alih-alih anova satu arah, uji peringkat bertanda Wilcoxon alih-alih uji t berpasangan, dan korelasi peringkat Spearman alih-alih regresi linier. Tes non-parametrik ini tidak mengasumsikan bahwa data sesuai dengan distribusi normal. Mereka berasumsi bahwa data dalam kelompok yang berbeda memiliki distribusi yang sama satu sama lain, namun; jika kelompok yang berbeda memiliki distribusi bentuk yang berbeda (misalnya, satu condong ke kiri, yang lain condong ke kanan), tes non-parametrik mungkin tidak lebih baik daripada yang parametrik.
Referensi
- Glass, GV, PD Peckham, dan JR Sanders. 1972. Konsekuensi kegagalan untuk memenuhi asumsi yang mendasari analisis efek tetap varians dan kovarian. Pdt. Educ. Res. 42: 237-288.
- Harwell, MR, EN Rubinstein, WS Hayes, dan CC Olds. 1992. Meringkas hasil Monte Carlo dalam penelitian metodologis: satu-dua faktor efek tetap kasus ANOVA. J. Educ. Stat. 17: 315-339.
- Lix, LM, JC Keselman, dan HJ Keselman. 1996. Konsekuensi pelanggaran asumsi ditinjau kembali: Tinjauan kuantitatif alternatif untuk analisis satu arah uji varians F. Pdt. Educ. Res. 66: 579-619.