Menunjukkan p itu p-nilai tes Anda (sebagai variabel acak) dan perbaiki beberapa α. Sebut hasil tes signifikan atau positif kapanp≤α. Kita punyaP(p≤α|H0)≤α. Apalagi, mariβ menjadi seperti itu P(p>α|H1)≤β. Kemudian1−β adalah kekuatan ujian.
Mengobati H0 dan H1 sebagai peristiwa (komplementer), teorema Bayes memberikan:
P(H1|p≤α)P(H0|p≤α)=P(p≤α|H1)P(p≤α|H0)⋅P(H1)P(H0)≥1−βα⋅P(H1)P(H0)
Ini menunjukkan bahwa peluang posting untuk
H1 adalah versi berskala dari peluang sebelumnya, dengan kekuatan penskalaan yang mendukung
H1 meningkat dengan
1−β. Ini berarti kita belajar lebih banyak dari tes positif kapan
1−β besar.
Untuk ilustrasi lebih lanjut, lihat interval kepercayaan diri (CI). Orang mungkin berpendapat bahwa ukuran sampel yang lebih besar akan membuat CI lebih sempit dan dengan demikian, jika tes signifikan untuk sampel yang lebih kecil, itu juga akan signifikan untuk sampel yang lebih besar. Namun, juga lokasi CI dapat bergeser ketika kami memasukkan lebih banyak data dalam sampel kami, berpotensi menjadikan hasilnya tidak signifikan. Dapat dibayangkan bahwa sampel yang lebih besar akan memiliki kesalahan standar yang jauh lebih besar dan dengan demikian CI akan menjadi lebih luas sebenarnya. Orang bisa mengatakan bahwa ukuran sampel yang lebih besar memberi fakta lebih banyak peluang untuk membuktikan diri.
Ada beberapa diskusi menarik akhir-akhir ini tentang interpretasi p-nilai, lihat, misalnya:
[1] Colquhoun, "Penyelidikan tingkat penemuan palsu dan salah tafsir nilai-p", Royal Society Open Science, 2014
[2] Colquhoun, "Reprodusibilitas Penelitian dan Misinterpretasi Nilai P", 2017, http://www.biorxiv.org/content/early/2017/08/07/144337
[3] "Apa yang akan dikatakan Cohen? Komentar tentang p<.005", https://replicationindex.wordpress.com/2017/08/02/what-would-cohen-say-a-comment-on-p-005/
Mengenai hasil khusus Anda, saya tidak memenuhi syarat untuk menilai itu. Hanya menggunakanp-nilai dan klasifikasi dari [2], itu adalah antara "bukti lemah: layak dilihat lagi" dan "bukti moderat untuk efek nyata".