Analisis
Karena ini adalah pertanyaan konseptual, untuk kesederhanaan mari kita pertimbangkan situasi di mana interval kepercayaan dikonstruksi untuk rata-rata menggunakan sampel acak dari ukuran dan sampel acak kedua diambil dari ukuran , semua dari distribusi Normal . (Jika Anda suka, Anda dapat mengganti dengan nilai dari distribusi Student derajat kebebasan; analisis berikut tidak akan berubah.)[ ˉ x ( 1 ) + Z α / 2 s ( 1 ) / √1−αμx(1)nx(2)m(μ,σ2)Ztn-1
[x¯(1)+Zα/2s(1)/n−−√,x¯(1)+Z1−α/2s(1)/n−−√]
μx(1)nx(2)m(μ,σ2)Ztn−1
Kemungkinan bahwa rata-rata sampel kedua terletak di dalam CI yang ditentukan oleh yang pertama adalah
Pr(x¯(1)+Zα/2n−−√s(1)≤x¯(2)≤x¯(1)+Z1−α/2n−−√s(1))=Pr(Zα/2n−−√s(1)≤x¯(2)−x¯(1)≤Z1−α/2n−−√s(1)).
Karena mean sampel pertama tidak tergantung pada standar deviasi sampel pertama (ini memerlukan normalitas) dan sampel kedua tidak tergantung pada yang pertama, perbedaan dalam sampel berarti tidak bergantung pada . Terlebih lagi, untuk interval simetris ini . Oleh karena itu, menulis untuk variabel acak dan mengkuadratkan kedua ketidaksetaraan, probabilitas yang dimaksud adalah sama dengans(1)U= ˉ x (2)- ˉ x (1)s(1)Zα/2=-Z1-α/2Ss(1)x¯(1)s(1)U=x¯(2)−x¯(1)s(1)Zα/2=−Z1−α/2Ss(1)
Pr(U2≤(Z1−α/2n−−√)2S2)=Pr(U2S2≤(Z1−α/2n−−√)2).
Hukum harapan menyiratkan memiliki rata-rata dan varian0U0
Var(U)=Var(x¯(2)−x¯(1))=σ2(1m+1n).
Karena adalah kombinasi linear dari variabel Normal, ia juga memiliki distribusi Normal. Oleh karena itu adalah dikali variabel . Kita sudah tahu bahwa adalah kali variabel . Akibatnya, adalah kali variabel dengan distribusi . Probabilitas yang diperlukan diberikan oleh distribusi F sebagaiU 2 σ 2 ( 1UU2χ2(1)S2σ2/nχ2(n-1)U2/S21/n+1/mF(1,n-1)σ2(1n+1m)χ2(1)S2σ2/nχ2(n−1)U2/S21/n+1/mF(1,n−1)
F1,n−1(Z21−α/21+n/m).(1)
Diskusi
Kasus yang menarik adalah ketika sampel kedua adalah ukuran yang sama dengan yang pertama, sehingga dan hanya dan menentukan probabilitas. Berikut adalah nilai-nilai dari diplot terhadap untuk .n/m=1nα(1)αn=2,5,20,50
Grafik naik ke nilai pembatas pada setiap saat meningkat. Ukuran uji tradisional ditandai dengan garis abu-abu vertikal. Untuk nilai lebih besar dari , peluang pembatas untuk adalah sekitar .αnα=0.05n=mα=0.0585%
Dengan memahami batas ini, kami akan mengintip rincian ukuran sampel kecil dan lebih memahami inti masalah. Ketika tumbuh besar, distribusi mendekati distribusi a . Dalam hal distribusi Normal standar , probabilitas kemudian mendekatin=mFχ2(1)Φ(1)
Φ(Z1−α/22–√)−Φ(Zα/22–√)=1−2Φ(Zα/22–√).
Misalnya, dengan , dan . Akibatnya nilai batas yang diperoleh oleh kurva pada karena meningkat akan menjadi . Anda dapat melihatnya hampir tercapai untuk (di mana peluangnya adalah .)α=0.05Zα/2/2–√≈−1.96/1.41≈−1.386Φ(−1.386)≈0.083α=0.05n1−2(0.083)=1−0.166=0.834n=500.8383…
Untuk kecil , hubungan antara dan probabilitas komplementer - risiko bahwa CI tidak mencakup rata-rata kedua - hampir sempurna adalah hukum kekuatan. αα Cara lain untuk menyatakan ini adalah bahwa probabilitas komplementer log hampir merupakan fungsi linear dari . Hubungan yang membatasi kira-kiralogα
log(2Φ(Zα/22–√))≈−1.79712+0.557203log(20α)+0.00657704(log(20α))2+⋯
Dengan kata lain, untuk besar dan mendekati nilai tradisional , akan mendekatin=mα0.05(1)
1−0.166(20α)0.557.
(Ini mengingatkan saya pada analisis interval kepercayaan yang tumpang tindih yang saya posting di /stats//a/18259/919 . Memang, kekuatan sihir di sana, , hampir merupakan kebalikan dari kekuatan sihir di sini, . Pada titik ini Anda harus dapat menafsirkan ulang analisis itu dalam hal reproduksibilitas percobaan.)1.910.557
Hasil percobaan
Hasil ini dikonfirmasi dengan simulasi langsung. R
Kode berikut mengembalikan frekuensi pertanggungan, peluang yang dihitung dengan , dan skor-Z untuk menilai seberapa besar perbedaannya. Skor Z biasanya berukuran kurang dari , terlepas dari (atau bahkan apakah atau CI dihitung), menunjukkan kebenaran rumus .2 n , m , μ , σ , α Z t ( 1 )(1)2n,m,μ,σ,αZt(1)
n <- 3 # First sample size
m <- 2 # Second sample size
sigma <- 2
mu <- -4
alpha <- 0.05
n.sim <- 1e4
#
# Compute the multiplier.
#
Z <- qnorm(alpha/2)
#Z <- qt(alpha/2, df=n-1) # Use this for a Student t C.I. instead.
#
# Draw the first sample and compute the CI as [l.1, u.1].
#
x.1 <- matrix(rnorm(n*n.sim, mu, sigma), nrow=n)
x.1.bar <- colMeans(x.1)
s.1 <- apply(x.1, 2, sd)
l.1 <- x.1.bar + Z * s.1 / sqrt(n)
u.1 <- x.1.bar - Z * s.1 / sqrt(n)
#
# Draw the second sample and compute the mean as x.2.
#
x.2 <- colMeans(matrix(rnorm(m*n.sim, mu, sigma), nrow=m))
#
# Compare the second sample means to the CIs.
#
covers <- l.1 <= x.2 & x.2 <= u.1
#
# Compute the theoretical chance and compare it to the simulated frequency.
#
f <- pf(Z^2 / ((n * (1/n + 1/m))), 1, n-1)
m.covers <- mean(covers)
(c(Simulated=m.covers, Theoretical=f, Z=(m.covers - f)/sd(covers) * sqrt(length(covers))))