Dari sudut pandang saya, masalah ini bermuara pada apa artinya melakukan tes signifikansi. Pengujian signifikansi dirancang sebagai sarana untuk membuat keputusan untuk menolak hipotesis nol atau untuk gagal menolaknya. Fisher sendiri memperkenalkan aturan 0,05 yang terkenal karena membuat keputusan (sewenang-wenang) itu.
Pada dasarnya, logika pengujian signifikansi adalah bahwa pengguna harus menentukan tingkat alfa untuk menolak hipotesis nol (konvensional 0,05) sebelum mengumpulkan data . Setelah menyelesaikan uji signifikansi, pengguna menolak nol jika nilai p lebih kecil dari tingkat alpha (atau gagal menolaknya sebaliknya).
Alasan mengapa Anda tidak dapat menyatakan bahwa efeknya sangat signifikan (katakanlah, pada level 0,001) adalah karena Anda tidak dapat menemukan bukti yang lebih kuat daripada yang ingin Anda temukan. Jadi, jika Anda menetapkan tingkat alfa Anda pada 0,05 sebelum tes, Anda hanya dapat menemukan bukti pada tingkat 0,05, terlepas dari seberapa kecil nilai p Anda. Dengan cara yang sama, berbicara tentang efek yang "agak signifikan" atau "mendekati signifikansi" juga tidak masuk akal karena Anda memilih kriteria arbitrer ini yaitu 0,05. Jika Anda menafsirkan logika pengujian signifikansi secara harfiah, apa pun yang lebih besar dari 0,05 tidak signifikan.
Saya setuju bahwa istilah-istilah seperti "mendekati signifikansi" sering digunakan untuk meningkatkan prospek publikasi. Namun, saya tidak berpikir bahwa penulis dapat disalahkan untuk itu karena budaya publikasi saat ini dalam beberapa ilmu masih sangat bergantung pada "cawan suci" 0,05.
Beberapa masalah ini dibahas dalam:
Gigerenzer, G. (2004). Statistik tanpa pikiran. Jurnal Sosial Ekonomi, 33 (5), 587-606.
Royall, R. (1997). Bukti statistik: paradigma kemungkinan (Vol. 71). Tekan CRC.