Iya dan tidak.
Pertama "ya"
Apa yang Anda amati adalah bahwa ketika tes dan interval kepercayaan didasarkan pada statistik yang sama, ada kesetaraan di antara mereka: kita dapat menafsirkan nilai- sebagai nilai terkecil dari α yang nilai nol parameter akan dimasukkan dalam interval kepercayaan 1 - α .pα1−α
Biarkan menjadi parameter yang tidak diketahui dalam ruang parameter Θ ⊆ R , dan biarkan sampel x = ( x 1 , ... , x n ) ∈ X n ⊆ R n menjadi realisasi dari variabel acak X = ( X 1 , ... , X n ) . Untuk kesederhanaan, menentukan interval kepercayaan saya α ( X ) sebagai random selang sehingga yang cakupan probabilitas P θθΘ⊆Rx=(x1,…,xn)∈Xn⊆RnX=(X1,…,Xn)Iα(X)
(Anda juga bisa mempertimbangkan interval yang lebih umum, di mana probabilitas cakupan dibatasi oleh atau kira-kira sama dengan 1 - α . Alasannya analog.)
Pθ(θ∈Iα(X))=1−αfor all α∈(0,1).
1−α
Pertimbangkan uji dua sisi dari hipotesis titik-nol terhadap alternatif H 1 ( θ 0 ) : θ ≠ θ 0 . Misalkan λ ( θ 0 , x ) menunjukkan nilai p dari tes. Untuk α ∈ ( 0 , 1 ) , H 0 ( θ 0 ) ditolak pada level α jikaH0(θ0):θ=θ0H1(θ0):θ≠θ0λ(θ0,x)α∈(0,1)H0(θ0)α . Level α rejection regionadalah himpunan x yang mengarah pada penolakan H 0 ( θ 0 ) :
R α ( θ 0 ) = { x ∈ R n : λ ( θ 0 , x ) ≤ α } .λ(θ0,x)≤αα xH0(θ0)
Rα(θ0)={x∈Rn:λ(θ0,x)≤α}.
Sekarang, pertimbangkan keluarga tes dua sisi dengan nilai-p , untuk θ ∈ Θ . Untuk keluarga seperti itu, kita dapat mendefinisikan daerah penolakan terbalik Q α ( x ) = { θ ∈ Θ : λ ( θ , x ) ≤ α } .λ(θ,x)θ∈Θ
Qα(x)={θ∈Θ:λ(θ,x)≤α}.
Untuk sembarang , H 0 ( θ 0 ) ditolak jika x ∈ R α ( θ 0 ) , yang terjadi jika dan hanya jika θ 0 ∈ Q α ( x ) , yaitu,
x ∈ R α ( θ 0 ) ⇔ θ 0 ∈ Q α ( x ) .
Jika tes didasarkan pada statistik uji dengan distribusi nol mutlak benar-benar benar-benar ditentukan, makaθ0H0(θ0)x∈Rα(θ0)θ0∈Qα(x)
x∈Rα(θ0)⇔θ0∈Qα(x).
bawah
H 0 ( θ 0 ) . Kemudian
P θ 0 ( X ∈ R α ( θ 0 ) ) = P θ 0 ( λ ( θ 0 , X ) ≤ α ) = α .
Karena persamaan ini berlaku untuk
θ 0 ∈ Θλ(θ0,X)∼U(0,1)H0(θ0)Pθ0(X∈Rα(θ0))=Pθ0(λ(θ0,X)≤α)=α.
θ0∈Θ dan karena persamaan di atas menunjukkan bahwa
maka set acak
Q α ( x ) selalu mencakup parameter benar
θ 0 dengan probabilitas
α . Akibatnya, membiarkan
Q C α ( x ) menunjukkan komplemen dari
QPθ0(X∈Rα(θ0))=Pθ0(θ0∈Qα(X)),
Qα(x)θ0αQCα(x) , untuk semua
θ 0 ∈ Θ kita memiliki
P θ 0 ( θ 0 ∈ Q C α ( X ) ) = 1 - α , yang
berarti bahwa komplemen dari daerah penolakan terbalik adalahinterval kepercayaan
1 - α untuk
θ .
Qα(x)θ0∈ΘPθ0(θ0∈QCα(X))=1−α,
1−αθ
zθx¯σ=1H0(θ)(x¯,θ)R0.05(−0.9)=(−∞,−1.52)∪(−0.281,∞)I0.05(1/2)=QC0.05(1/2)=(−0.120,1.120)
(Banyak dari ini diambil dari tesis PhD saya .)
Sekarang untuk "tidak"
θX
Fenomena ini berkaitan dengan masalah yang terkait dengan interval seperti itu yang tidak disarangkan, yang berarti bahwa interval 94% bisa lebih pendek dari interval 95%. Untuk lebih lanjut tentang ini, lihat Bagian 2.5 dari makalah saya terbaru ini (untuk muncul di Bernoulli).
Dan yang kedua "tidak"
θ0=0
Dan terkadang "ya" bukanlah hal yang baik
Seperti yang ditunjukkan oleh f coppens dalam komentar, terkadang interval dan tes memiliki tujuan yang agak bertentangan. Kami ingin interval pendek dan tes dengan daya tinggi, tetapi interval terpendek tidak selalu sesuai dengan tes dengan daya tertinggi. Untuk beberapa contohnya, lihat makalah ini (distribusi normal multivariat), atau ini (distribusi eksponensial), atau Bagian 4 dari tesis saya .
Bayesians juga bisa mengatakan ya dan tidak
Beberapa tahun yang lalu, saya memposting pertanyaan di sini tentang apakah uji-interval-kesetaraan ada juga dalam statistik Bayesian. Jawaban singkatnya adalah bahwa dengan menggunakan pengujian hipotesis Bayesian standar, jawabannya adalah "tidak". Dengan sedikit merumuskan ulang masalah pengujian, jawabannya bisa "ya". (Upaya saya menjawab pertanyaan saya sendiri akhirnya berubah menjadi kertas !)