Gagal menolak hipotesis nol adalah bukti bahwa hipotesis nol itu benar, tetapi itu mungkin bukan bukti yang sangat baik , dan itu tentu saja tidak membuktikan hipotesis nol.
Mari kita mengambil jalan memutar singkat. Pertimbangkan klise lama:
Tidak adanya bukti bukanlah bukti ketidakhadiran.
Terlepas dari popularitasnya, pernyataan ini tidak masuk akal. Jika Anda mencari sesuatu dan gagal menemukannya, itu adalah bukti mutlak bahwa itu tidak ada di sana. Seberapa baik bukti itu tergantung pada seberapa teliti pencarian Anda. Pencarian sepintas memberikan bukti yang lemah; pencarian lengkap memberikan bukti kuat.
Sekarang, kembali ke pengujian hipotesis. Ketika Anda menjalankan tes hipotesis, Anda mencari bukti bahwa hipotesis nol itu tidak benar. Jika Anda tidak menemukannya, maka itu tentu bukti bahwa hipotesis nol itu benar, tetapi seberapa kuat bukti itu? Untuk mengetahuinya, Anda harus tahu seberapa besar kemungkinan bukti yang akan membuat Anda menolak hipotesis nol dapat menghindari pencarian Anda. Artinya, berapa probabilitas negatif palsu pada tes Anda? Ini terkait dengan kekuatan, , dari tes (khusus, itu adalah pelengkap, 1- .)βββ
Sekarang, kekuatan tes, dan karenanya tingkat negatif palsu, biasanya tergantung pada ukuran efek yang Anda cari. Efek besar lebih mudah dideteksi daripada efek kecil. Oleh karena itu, tidak ada satu untuk percobaan, dan oleh karena itu tidak ada jawaban pasti untuk pertanyaan seberapa kuat bukti untuk hipotesis nol. Dengan kata lain, selalu ada beberapa ukuran efek yang cukup kecil sehingga tidak dikesampingkan oleh percobaan.β
Dari sini, ada dua cara untuk melanjutkan. Terkadang Anda tahu Anda tidak peduli dengan ukuran efek yang lebih kecil dari ambang tertentu. Dalam hal itu, Anda mungkin harus membingkai ulang percobaan Anda sehingga hipotesis nol adalah bahwa efeknya berada di atas ambang itu, dan kemudian menguji hipotesis alternatif bahwa pengaruhnya di bawah ambang. Atau, Anda dapat menggunakan hasil Anda untuk menetapkan batas pada ukuran efek yang dapat dipercaya. Kesimpulan Anda adalah bahwa ukuran efek terletak pada beberapa interval, dengan beberapa probabilitas. Pendekatan itu hanya beberapa langkah dari perawatan Bayesian, yang mungkin ingin Anda pelajari lebih lanjut, jika Anda sering menemukan diri Anda dalam situasi seperti ini.
Ada jawaban yang bagus untuk pertanyaan terkait yang menyentuh pada bukti pengujian ketidakhadiran , yang mungkin berguna bagi Anda.