Contoh lain dari tes dengan hasil yang mungkin tidak meyakinkan adalah tes binomial untuk proporsi ketika hanya proporsi, bukan ukuran sampel, yang tersedia. Ini tidak sepenuhnya tidak realistis - kita sering melihat atau mendengar klaim formulir "73% orang setuju bahwa ..." dan seterusnya, di mana penyebutnya tidak tersedia.
Misalkan misalnya kita hanya tahu proporsi sampel dibulatkan benar ke seluruh persen terdekat , dan kami ingin menguji terhadap pada tingkat .H 1 : π ≠ 0,5 α = 0,05H0: π= 0,5H1: π≠ 0,5α = 0,05
Jika proporsi yang diamati adalah maka ukuran sampel untuk proporsi yang diamati harus paling tidak 19, karena adalah fraksi dengan penyebut terendah yang akan membulatkan menjadi . Kita tidak tahu apakah jumlah keberhasilan yang diamati adalah 1 dari 19, 1 dari 20, 1 dari 21, 1 dari 22, 2 dari 37, 2 dari 38, 3 dari 55, 5 dari 55, 5 dari 100 atau 50 dari 1000 ... tetapi yang mana dari ini, hasilnya akan signifikan pada tingkat .1p = 5 % 5%α=0,051195 %α = 0,05
Di sisi lain, jika kita tahu proporsi sampel adalah maka kita tidak tahu apakah jumlah keberhasilan yang diamati adalah 49 dari 100 (yang tidak akan signifikan pada level ini) atau 4900 dari 10.000 (yang hanya mencapai signifikansi). Jadi dalam hal ini hasilnya tidak dapat disimpulkan.p = 49 %
Perhatikan bahwa dengan persentase bulat , tidak ada wilayah "gagal menolak": bahkan konsisten dengan sampel seperti 49.500 sukses dari 100.000, yang akan menghasilkan penolakan, serta sampel seperti 1 sukses dari 2 percobaan , yang akan menghasilkan kegagalan untuk menolak .H 0p = 50 %H0
Berbeda dengan tes Durbin-Watson, saya belum pernah melihat hasil tabulasi yang persentasenya signifikan; situasi ini lebih halus karena tidak ada batas atas dan bawah untuk nilai kritis. Hasil jelas tidak dapat disimpulkan, karena nol keberhasilan dalam satu percobaan tidak signifikan namun tidak ada keberhasilan dalam sejuta uji coba akan sangat signifikan. Kita telah melihat bahwa tidak meyakinkan tetapi ada hasil yang signifikan misalnya di antaranya. Selain itu, kurangnya cut-off bukan hanya karena kasus anomali dan . Bermain-main sedikit, sampel paling signifikan yang terkait denganp = 0 %p = 50 %p = 5 %p = 0 %p = 100 %p=16%adalah 3 keberhasilan dalam sampel 19, dalam hal ini jadi akan signifikan; untuk kita mungkin memiliki 1 keberhasilan dalam 6 percobaan yang tidak signifikan, sehingga kasus ini tidak dapat disimpulkan (karena jelas ada sampel lain dengan yang akan menjadi signifikan); untuk mungkin ada 2 keberhasilan dalam 11 percobaan (tidak signifikan, ) sehingga kasus ini juga tidak meyakinkan; tetapi untuk sampel paling signifikan yang mungkin adalah 3 keberhasilan dalam 19 percobaan dengan jadi ini signifikan lagi.Pr(X≤3)≈0.00221<0.025p=17%Pr(X≤1)≈0.109>0.025p=16%p=18%p = 19 % Pr ( X ≤ 3 ) ≈ 0,0106 < 0,025Pr(X≤2)≈0.0327>0.025p=19%Pr(X≤3)≈0.0106<0.025
Bahkan adalah persentase bulat tertinggi di bawah 50% menjadi signifikan pada level 5% (nilai-p tertinggi akan untuk 4 keberhasilan dalam 17 percobaan dan hanya signifikan), sedangkan adalah hasil non-nol terendah yang tidak dapat disimpulkan (karena dapat sesuai dengan 1 keberhasilan dalam 8 percobaan). Seperti yang bisa dilihat dari contoh di atas, apa yang terjadi di antaranya lebih rumit! Grafik di bawah ini memiliki garis merah pada : poin di bawah garis jelas signifikan tetapi yang di atasnya tidak dapat disimpulkan. Pola nilai-p sedemikian rupa sehingga tidak akan ada batas bawah dan atas tunggal pada persentase yang diamati untuk hasil menjadi signifikan secara jelas.p = 13 % α = 0,05p=24%p=13%α=0.05
Kode r
# need rounding function that rounds 5 up
round2 = function(x, n) {
posneg = sign(x)
z = abs(x)*10^n
z = z + 0.5
z = trunc(z)
z = z/10^n
z*posneg
}
# make a results data frame for various trials and successes
results <- data.frame(successes = rep(0:100, 100),
trials = rep(1:100, each=101))
results <- subset(results, successes <= trials)
results$percentage <- round2(100*results$successes/results$trials, 0)
results$pvalue <- mapply(function(x,y) {
binom.test(x, y, p=0.5, alternative="two.sided")$p.value}, results$successes, results$trials)
# make a data frame for rounded percentages and identify which are unambiguously sig at alpha=0.05
leastsig <- sapply(0:100, function(n){
max(subset(results, percentage==n, select=pvalue))})
percentages <- data.frame(percentage=0:100, leastsig)
percentages$significant <- percentages$leastsig
subset(percentages, significant==TRUE)
# some interesting cases
subset(results, percentage==13) # inconclusive at alpha=0.05
subset(results, percentage==24) # unambiguously sig at alpha=0.05
# plot graph of greatest p-values, results below red line are unambiguously significant at alpha=0.05
plot(percentages$percentage, percentages$leastsig, panel.first = abline(v=seq(0,100,by=5), col='grey'),
pch=19, col="blue", xlab="Rounded percentage", ylab="Least significant two-sided p-value", xaxt="n")
axis(1, at = seq(0, 100, by = 10))
abline(h=0.05, col="red")
(Kode pembulatan diambil dari pertanyaan StackOverflow ini .)