Secara umum (tidak hanya dalam uji kelaikan, tetapi dalam banyak situasi lain), Anda tidak dapat menyimpulkan bahwa nol itu benar, karena ada alternatif yang secara efektif tidak dapat dibedakan dari nol pada ukuran sampel yang diberikan.
Berikut adalah dua distribusi, standar normal (garis solid hijau), dan yang tampak serupa (standar 90% normal, dan beta standar 10% (2,2), ditandai dengan garis putus-putus merah):
Yang merah tidak normal. Pada katakanlah , kita memiliki sedikit peluang untuk menemukan perbedaannya, jadi kita tidak dapat menyatakan bahwa data diambil dari distribusi normal - bagaimana jika itu berasal dari distribusi non-normal seperti yang merah?n = 100
Fraksi yang lebih kecil dari beta standar dengan parameter yang sama tetapi lebih besar akan jauh lebih sulit untuk dilihat sebagai berbeda dari normal.
Tetapi mengingat bahwa data nyata hampir tidak pernah dari beberapa distribusi sederhana, jika kita memiliki oracle yang sempurna (atau ukuran sampel efektif tak terbatas), kita pada dasarnya akan selalu menolak hipotesis bahwa data tersebut berasal dari beberapa bentuk distribusi sederhana.
Seperti George Box terkenal mengatakan , " Semua model salah, tetapi beberapa berguna. "
Pertimbangkan, misalnya, menguji normalitas. Ini mungkin bahwa data benar-benar datang dari sesuatu yang dekat dengan normal, tetapi akan mereka pernah menjadi persis yang normal? Mereka mungkin tidak pernah ada.
Alih-alih, yang terbaik yang bisa Anda harapkan dengan bentuk pengujian itu adalah situasi yang Anda gambarkan. (Lihat, misalnya, posting Apakah pengujian normal pada dasarnya tidak berguna?, Tetapi ada sejumlah posting lain di sini yang membuat poin terkait)
F
Perhatikan gambar di atas lagi. Distribusi merah adalah non-normal, dan dengan sampel yang sangat besar kita bisa menolak uji normalitas berdasarkan sampel dari itu ... tetapi pada ukuran sampel yang jauh lebih kecil, regresi dan dua sampel t-tes (dan banyak tes lainnya selain itu) akan berperilaku sangat baik sehingga tidak ada gunanya untuk khawatir tentang ketidak normalan itu bahkan sedikit.
μ = μ0
Anda mungkin dapat menentukan beberapa bentuk penyimpangan tertentu dan melihat sesuatu seperti pengujian kesetaraan, tetapi agak rumit dengan goodness of fit karena ada banyak cara untuk distribusi yang dekat tetapi berbeda dari yang dihipotesiskan, dan berbeda bentuk perbedaan dapat memiliki dampak berbeda pada analisis. Jika alternatifnya adalah keluarga yang lebih luas yang memasukkan nol sebagai kasus khusus, pengujian kesetaraan lebih masuk akal (misalnya, menguji eksponensial terhadap gamma) - dan memang, pendekatan "dua uji satu sisi" dijalankan, dan itu mungkin menjadi cara untuk memformalkan "cukup dekat" (atau itu akan terjadi jika model gamma benar, tetapi pada kenyataannya itu sendiri akan hampir pasti akan ditolak oleh tes goodness of fit biasa,
Pengujian goodness of fit (dan seringkali lebih luas, pengujian hipotesis) benar-benar hanya cocok untuk berbagai situasi yang cukup terbatas. Pertanyaan yang biasanya ingin dijawab orang tidak begitu tepat, tetapi agak lebih kabur dan lebih sulit dijawab - tetapi seperti yang dikatakan John Tukey, " Jauh lebih baik jawaban perkiraan untuk pertanyaan yang tepat, yang seringkali tidak jelas, daripada jawaban yang tepat untuk pertanyaan itu. pertanyaan yang salah, yang selalu bisa dibuat tepat. "
Pendekatan yang masuk akal untuk menjawab pertanyaan yang lebih tidak jelas dapat mencakup simulasi dan penyelidikan ulang untuk menilai sensitivitas analisis yang diinginkan terhadap asumsi yang Anda pertimbangkan, dibandingkan dengan situasi lain yang juga cukup konsisten dengan data yang tersedia.
ε