Saya kira sebagian besar jawaban ini tidak menjawab pertanyaan secara umum. Mereka dibatasi pada kasus ketika ada hipotesis nol sederhana dan ketika statistik uji memiliki CDF terbalik (seperti dalam variabel acak kontinu yang memiliki peningkatan CDF ketat). Kasus-kasus ini adalah kasus-kasus yang kebanyakan orang cenderung pedulikan dengan uji-z dan uji-t, meskipun untuk menguji rerata binomial (misalnya) seseorang tidak memiliki CDF seperti itu. Apa yang disediakan di atas tampaknya benar bagi saya untuk kasus-kasus terbatas ini.
Jika hipotesis nol adalah gabungan maka hal-hal sedikit lebih rumit. Bukti paling umum dari fakta ini yang pernah saya lihat di bawah kasus komposit menggunakan beberapa asumsi mengenai daerah penolakan disediakan dalam Lehmann dan Romano "Pengujian Hipotesis Statistik," halaman 63-64. Saya akan mencoba mereproduksi argumen di bawah ini ...
Kami menguji hipotesis nol versus hipotesis alternatif didasarkan pada statistik uji, yang kami akan menunjukkan sebagai variabel acak . Statistik uji diasumsikan berasal dari beberapa kelas parametrik, yaitu, , di mana adalah elemen dari keluarga distribusi probabilitas , dan adalah ruang parameter. Hipotesis nol dan hipotesis alternatif membentuk partisi di
H0H1XX∼PθPθP≡{Pθ∣θ∈Θ}ΘH0:θ∈Θ0H1:θ∈Θ1ΘΘ=Θ0∪Θ1
di mana
Θ0∩Θ1=∅.
Hasil tes dapat dinotasikan
mana untuk setiap set kita mendefinisikan
Di sini adalah tingkat signifikansi kami, dan menunjukkan wilayah penolakan tes untuk tingkat signifikansi .ϕα(X)=1Rα(X)
S1S(X)={1,0,X∈S,X∉S.
αRαα
Misalkan daerah penolakan memenuhi
jika . Dalam kasus daerah penolakan bersarang, akan berguna untuk menentukan tidak hanya apakah hipotesis nol ditolak pada tingkat signifikansi yang diberikan , tetapi juga untuk menentukan tingkat signifikansi terkecil di mana hipotesis nol akan ditolak. Tingkat ini dikenal sebagai nilai -p ,
Angka ini memberi kita gambaran tentang seberapa kuat data (seperti yang digambarkan oleh uji statistik ) bertentangan dengan hipotesis nol . Rα⊂Rα′
α<α′αp^=p^(X)≡inf{α∣X∈Rα},
XH0
Misalkan untuk beberapa dan bahwa . Misalkan tambahan bahwa daerah penolakan mematuhi properti bersarang yang dinyatakan di atas. Maka yang berikut ini berlaku:X∼Pθθ∈ΘH0:θ∈Θ0Rα
Jika untuk semua , maka untuk ,
supθ∈Θ0Pθ(X∈Rα)≤α0<α<1θ∈Θ0Pθ(p^≤u)≤ufor all0≤u≤1.
Jika untuk kita memiliki untuk semua , maka untuk kita memiliki
θ∈Θ0Pθ(X∈Rα)=α0<α<1θ∈Θ0Pθ(p^≤u)=ufor all0≤u≤1.
Perhatikan properti pertama ini hanya memberi tahu kita bahwa tingkat positif palsu dikontrol pada dengan menolak ketika nilai-p kurang dari , dan properti kedua memberi tahu kita (diberi asumsi tambahan) bahwa nilai-p didistribusikan secara seragam di bawah nol hipotesa.uu
Buktinya adalah sebagai berikut:
Biarkan , dan anggap untuk semua . Kemudian dengan definisi , kita memiliki untuk semua . Dengan monotonitas dan asumsi, maka untuk semua . Membiarkan , maka .θ∈Θ0supθ∈Θ0Pθ(X∈Rα)≤α0<α<1p^{p^≤u}⊂{X∈Rv}u<vPθ(p^≤u)≤Pθ(X∈Rv)≤vu<vv↘uPθ(p^≤u)≤u
Biarkan , dan asumsikan bahwa untuk semua . Kemudian , dan secara monotonik maka . Mempertimbangkan (1), maka . θ∈Θ0Pθ(X∈Rα)=α0<α<1{X∈Ru}⊂{p^(X)≤u}u=Pθ(X∈Ru)≤Pθ(p^≤u)Pθ(p^(X)≤u)=u
Perhatikan bahwa asumsi dalam (2) tidak berlaku ketika statistik uji diskrit bahkan jika hipotesis nol sederhana daripada komposit. Ambil contoh dengan dan . Yaitu, balik koin sepuluh kali dan uji apakah itu adil vs bias terhadap kepala (dikodekan sebagai 1). Probabilitas melihat 10 kepala dalam 10 koin membalik adalah (1/2) ^ 10 = 1/1024. Probabilitas melihat 9 atau 10 kepala dalam 10 membalik koin yang adil adalah 11/1024. Untuk apa pun secara ketat antara 1/1024 dan 11/1024, Anda akan menolak nol jika , tetapi kami tidak memilikinya untuk nilai-nilai kapanX∼Binom(10,θ)H0:θ=.5H1:θ>0.5αX=10Pr(X∈Rα)=ααθ=0.5 . Sebagai gantinya untuk . Pr(X∈Rα)=1/1024α