Sebagai contoh, orang sering memilih untuk menggunakan tes non parametrik ketika beberapa tes lain menunjukkan bahwa residu tidak terdistribusi secara normal. Pendekatan ini tampaknya diterima secara luas tetapi tampaknya tidak setuju dengan kalimat pertama dalam paragraf ini. Saya hanya berharap mendapat klarifikasi tentang masalah ini.
Ya, banyak orang melakukan hal semacam ini, dan mengubah tes kedua mereka menjadi yang dapat mengatasi heteroskedastisitas ketika mereka menolak persamaan varian, dan seterusnya.
Hanya karena sesuatu itu biasa, bukan berarti itu bijak.
Memang, di beberapa tempat (saya tidak akan menyebutkan disiplin yang paling buruk) banyak pengujian hipotesis formal ini bergantung pada pengujian hipotesis formal lainnya yang sebenarnya diajarkan.
Masalah dengan melakukannya adalah prosedur Anda tidak memiliki sifat nominalnya, kadang-kadang bahkan tidak menutup. (Di sisi lain, mengasumsikan hal-hal seperti itu tanpa pertimbangan sama sekali untuk kemungkinan pelanggaran ekstrem bisa jadi lebih buruk.)
Beberapa makalah menyarankan bahwa untuk kasus heteroskedastik, Anda lebih baik hanya bertindak seolah-olah varians tidak sama daripada menguji untuk itu dan hanya melakukan sesuatu tentang hal itu pada penolakan.
Dalam kasus normalitas kurang jelas. Paling tidak dalam sampel besar, dalam banyak kasus, normalitas tidak terlalu penting (tetapi ironisnya, dengan sampel besar, uji normalitas Anda lebih cenderung ditolak), selama non-normalitas tidak terlalu liar. Satu pengecualian adalah untuk interval prediksi, di mana Anda benar-benar membutuhkan asumsi distribusi Anda agar mendekati kanan.
Sebagian, satu masalah adalah bahwa tes hipotesis menjawab pertanyaan yang berbeda dari yang perlu dijawab. Anda tidak benar-benar perlu tahu 'apakah datanya benar-benar normal' (hampir selalu, itu tidak sepenuhnya normal a priori ). Pertanyaannya agak 'seberapa parah tingkat non-normalitas akan mempengaruhi kesimpulan saya'.
Masalah kedua biasanya hanya tentang ukuran sampel independen atau benar-benar menjadi lebih baik dengan meningkatnya ukuran sampel - namun tes hipotesis hampir selalu menolak pada ukuran sampel besar.
Ada banyak situasi di mana ada prosedur yang kuat atau bahkan distribusi gratis yang sangat dekat dengan sepenuhnya efisien bahkan pada normal (dan berpotensi jauh lebih efisien pada beberapa keberangkatan yang cukup sederhana dari itu) - dalam banyak kasus tampaknya konyol untuk tidak mengambil pendekatan bijaksana yang sama.