Asumsi normalitas apa yang diperlukan untuk uji-t yang tidak berpasangan? Dan kapan mereka bertemu?

12

Jika kita ingin melakukan uji-t berpasangan, persyaratannya adalah (jika saya mengerti dengan benar) bahwa perbedaan rata - rata antara unit pengukuran yang cocok akan didistribusikan secara normal.

Dalam uji-t berpasangan, yaitu diartikulasikan (AFAIK) dalam permintaan bahwa perbedaan antara unit pengukuran yang cocok akan didistribusikan secara normal (bahkan jika distribusi masing-masing dari dua kelompok yang dibandingkan tidak normal).

Namun, dalam uji-t yang tidak berpasangan, kita tidak dapat berbicara tentang perbedaan antara unit yang cocok, jadi kita memerlukan pengamatan dari kedua kelompok menjadi normal sehingga perbedaan rata-rata mereka akan normal. Yang mengarahkan saya ke pertanyaan saya:

Apakah mungkin untuk dua distribusi non-normal sehingga perbedaan rata-rata mereka terdistribusi secara normal? (dan dengan demikian, memenuhi persyaratan yang kami butuhkan untuk melakukan uji-t yang tidak berpasangan pada mereka - lagi - sejauh yang saya mengerti).

Pembaruan: (terima kasih semua atas jawabannya) Saya melihat bahwa aturan umum yang kami cari adalah bahwa perbedaan rata-rata akan normal, yang tampaknya merupakan asumsi yang baik (di bawah n yang cukup besar) karena CLT. Ini luar biasa bagi saya (tidak mengejutkan, hanya luar biasa), seperti bagaimana ini bekerja untuk uji-t berpasangan, tetapi tidak akan bekerja dengan baik untuk uji-t sampel tunggal. Berikut ini beberapa kode R untuk diilustrasikan:

n1 <- 10
n2 <- 10
mean1 <- 50
mean2 <- 50
R <- 10000

# diffs <- replicate(R, mean(rexp(n1, 1/mean1)) - mean(runif(n2, 0, 2*mean2)))
# hist(diffs)

P <- numeric(R)
MEAN <- numeric(R)
for(i in seq_len(R))
{
    y1 <- rexp(n1, 1/mean1)
    y2 <- runif(n2, 0, 2*mean2)
    MEAN[i] <- mean(y1) - mean(y2)
    P[i] <- t.test(y1,y2)$p.value
}
# diffs <- replicate(R, mean(rexp(n1, 1/mean1)) - mean(runif(n2, 0, 2*mean2)))
par(mfrow = c(1,2))
hist(P)
qqplot(P, runif(R)); abline(0,1)
sum(P<.05) / R # for n1=n2=10 -> 0.0715 # wrong type I error, but only for small n1 and n2 (for larger ones, this effect disappears)



n1 <- 100
mean1 <- 50
R <- 10000
P_y1 <- numeric(R)

for(i in seq_len(R))
{
    y1 <- rexp(n1, 1/mean1)
    P_y1[i] <- t.test(y1 , mu = mean1)$p.value
}

par(mfrow = c(1,2))
hist(P_y1)
qqplot(P_y1, runif(R)); abline(0,1)
sum(P_y1<.05) / R # for n1=n2=10 -> 0.057  # "wrong" type I error

Terima kasih.

t-test normality-assumption assumptions

— Tal Galili
sumber

5

Tentu . Biarkan menjadi sampel bivariat iid Anda. Biarkan memiliki distribusi sembarang dan bawa mana iid .

(X_{i}, Y_{i})

$(X_i,Y_i)$

X_{i}

$X_i$

F

$F$

Y_{i} = X_{i} + Z_{i}

$Y_i = X_i + Z_i$

{Z_{i}}

$\{Z_i\}$

N (0, σ^{2})

$\mathcal{N}(0,\sigma^2)$

— kardinal

17

Dalam praktiknya, Teorema Limit Pusat meyakinkan kita bahwa, di bawah berbagai asumsi, distribusi dari dua sampel berarti akan diuji sendiri mendekati distribusi Normal ketika ukuran sampel menjadi besar, terlepas (di sinilah asumsi datang) dari distribusi data yang mendasarinya. Sebagai akibatnya, ketika ukuran sampel semakin besar, perbedaan rata-rata menjadi terdistribusi secara normal, dan persyaratan yang diperlukan untuk t-statistik dari uji-t tidak berpasangan agar distribusi t nominal menjadi puas. Jadi, pertanyaan yang lebih praktis yang bisa diterapkan mungkin, seberapa besar ukuran sampel harus sebelum saya dapat dengan aman mengabaikan perbedaan antara distribusi aktual statistik dan distribusi t?

Dalam banyak kasus, jawabannya adalah "tidak terlalu besar", terutama ketika distribusi yang mendasarinya cukup dekat dengan simetris. Sebagai contoh, saya mensimulasikan 100.000 tes membandingkan rata-rata dua distribusi Uniform (0,1), masing-masing dengan ukuran sampel 10, dan, ketika menguji pada tingkat kepercayaan 95%, sebenarnya menolak nol 5,19% dari waktu - hampir tidak berbeda dari tingkat penolakan nominal 5% yang kami harapkan (meskipun sekitar 2,7 standar deviasi di atas 5%.)

Inilah sebabnya mengapa orang menggunakan uji-t dalam segala situasi di mana asumsi yang mendasarinya tidak benar-benar terpenuhi, tetapi tentu saja jarak tempuh Anda mungkin berbeda-beda, tergantung pada spesifik masalah Anda. Namun, ada tes lain yang tidak memerlukan Normalitas, seperti tes Wilcoxon, yang, bahkan ketika data terdistribusi secara normal, adalah, asimptotik, sekitar 95% seefisien uji-t (yaitu, membutuhkan ukuran sampel dari N / 0,95 untuk memiliki kekuatan yang sama dengan uji-t dengan ukuran sampel N, saat N menuju tak terhingga). Ketika data tidak terdistribusi secara normal, itu bisa (tidak harus) jauh lebih baik daripada uji-t.

— Jbowman
sumber

6

Dalam pengalaman saya, ukuran sampel yang diperlukan untuk distribusi menjadi akurat seringkali lebih besar daripada ukuran sampel yang ada. Tes peringkat bertanda Wilcoxon sangat efisien seperti yang Anda katakan, dan itu kuat, jadi saya hampir selalu lebih suka daripada uji .

t

$t$

t

$t$

— Frank Harrell

Terima kasih Frank - komentar Anda membantu saya mengartikulasikan pertanyaan yang lebih dekat dengan apa yang saya cari: stats.stackexchange.com/questions/19681/…

— Tal Galili

1

Tentu saja. Jika ini bukan masalahnya maka uji-t sampel independen tidak akan banyak berguna. Kami benar-benar membutuhkan ukuran sampel yang lebih besar karena bagi kami untuk menguji perbedaan rata-rata antara dua populasi yang tidak normal, kami perlu mengajukan banding ke CLT.

Sebagai contoh cepat mari kita asumsikan kita memiliki populasi 1 yang berasal dari eksponensial dengan rata-rata 25 dan populasi 2 terdistribusi secara merata dengan rata-rata 30. Kami bahkan akan memberi mereka ukuran sampel yang berbeda. Kita dapat memeriksa seperti apa distribusi perbedaan dalam sampel berarti menggunakan R relatif mudah menggunakan fungsi ulangan.

n1 <- 30
n2 <- 25
mean1 <- 25
mean2 <- 30

diffs <- replicate(10000, mean(rexp(n1, 1/mean1)) - mean(runif(n2, 0, 2*mean2)))
hist(diffs)

Bermain-main dengan ukuran sampel akan menunjukkan bahwa pada ukuran sampel yang rendah kita tidak benar-benar memiliki normalitas tetapi meningkatkan ukuran sampel memberi kita distribusi pengambilan sampel yang lebih normal untuk perbedaan cara. Tentu saja Anda dapat mengubah distribusi yang digunakan dalam contoh ini untuk mengeksplorasi lebih lanjut. hist (berbeda)

— Alasan
sumber