Nilai-P didefinisikan sebagai probabilitas untuk memperoleh uji-statistik paling tidak sama ekstrim dengan apa yang diamati, dengan asumsi hipotesis nol adalah benar. Dengan kata lain,
Tetapi bagaimana jika uji-statistik bimodal dalam distribusi? Apakah nilai-p berarti dalam konteks ini? Sebagai contoh, saya akan mensimulasikan beberapa data bimodal di R:
set.seed(0)
# Generate bi-modal distribution
bimodal <- c(rnorm(n=100,mean=25,sd=3),rnorm(n=100,mean=100,sd=5))
hist(bimodal, breaks=100)
Dan mari kita asumsikan kita mengamati nilai statistik uji 60. Dan di sini kita tahu dari gambar nilai ini sangat tidak mungkin . Jadi idealnya, saya ingin prosedur statistik yang saya gunakan (katakanlah, p-value) untuk mengungkapkan ini. Tetapi jika kita menghitung nilai p seperti yang didefinisikan, kita mendapatkan nilai p yang cukup tinggi
observed <- 60
# Get P-value
sum(bimodal[bimodal >= 60])/sum(bimodal)
[1] 0.7991993
Jika saya tidak tahu distribusinya, saya akan menyimpulkan bahwa apa yang saya amati hanyalah kebetulan belaka. Tetapi kita tahu ini tidak benar.
Saya kira pertanyaan yang saya miliki adalah: Mengapa, ketika menghitung nilai-p, apakah kita menghitung probabilitas untuk nilai-nilai "setidaknya paling ekstrim seperti" yang diamati? Dan jika saya menghadapi situasi seperti yang saya simulasikan di atas, apa solusi alternatifnya?