Asumsi normalitas dari uji-t
Pertimbangkan populasi besar tempat Anda dapat mengambil banyak sampel berbeda dengan ukuran tertentu. (Dalam studi tertentu, Anda biasanya hanya mengumpulkan satu dari sampel ini.)
Uji-t mengasumsikan bahwa rata-rata dari sampel yang berbeda terdistribusi secara normal; tidak berasumsi bahwa populasi terdistribusi secara normal.
Dengan teorema limit pusat, berarti sampel dari suatu populasi dengan varian terbatas mendekati distribusi normal terlepas dari distribusi populasi. Aturan praktis mengatakan bahwa mean sampel pada dasarnya terdistribusi normal selama ukuran sampel setidaknya 20 atau 30. Agar uji-t valid pada sampel dengan ukuran lebih kecil, distribusi populasi harus mendekati normal.
Uji-t tidak valid untuk sampel kecil dari distribusi tidak normal, tetapi valid untuk sampel besar dari distribusi tidak normal.
Sampel kecil dari distribusi tidak normal
Seperti yang dicatat Michael di bawah ini, ukuran sampel yang diperlukan untuk distribusi rata-rata untuk mendekati normalitas tergantung pada tingkat non-normalitas populasi. Untuk distribusi yang mendekati normal, Anda tidak perlu sampel sebesar distribusi yang sangat tidak normal.
Berikut adalah beberapa simulasi yang dapat Anda jalankan di R untuk merasakan hal ini. Pertama, berikut adalah beberapa distribusi populasi.
curve(dnorm,xlim=c(-4,4)) #Normal
curve(dchisq(x,df=1),xlim=c(0,30)) #Chi-square with 1 degree of freedom
Berikutnya adalah beberapa simulasi sampel dari distribusi populasi. Di setiap baris ini, "10" adalah ukuran sampel, "100" adalah jumlah sampel dan fungsi setelahnya menentukan distribusi populasi. Mereka menghasilkan histogram dari rata-rata sampel.
hist(colMeans(sapply(rep(10,100),rnorm)),xlab='Sample mean',main='')
hist(colMeans(sapply(rep(10,100),rchisq,df=1)),xlab='Sample mean',main='')
Agar uji-t valid, histogram ini harus normal.
require(car)
qqp(colMeans(sapply(rep(10,100),rnorm)),xlab='Sample mean',main='')
qqp(colMeans(sapply(rep(10,100),rchisq,df=1)),xlab='Sample mean',main='')
Utilitas uji-t
Saya harus mencatat bahwa semua pengetahuan yang baru saja saya berikan agak usang; sekarang kita memiliki komputer, kita bisa melakukan yang lebih baik daripada uji-t. Seperti yang dicatat Frank, Anda mungkin ingin menggunakan tes Wilcoxon di mana pun Anda diajari untuk menjalankan uji-t.