Ada masalah dengan simulasi asli di pos ini, yang semoga sekarang diperbaiki.
Sementara perkiraan standar deviasi sampel cenderung tumbuh bersama dengan pembilang sebagai rata-rata menyimpang dari , ini ternyata tidak memiliki semua yang besar berpengaruh pada daya pada tingkat signifikansi "khas", karena dalam sampel menengah hingga besar, masih cenderung cukup besar untuk ditolak. Dalam sampel yang lebih kecil itu mungkin memiliki beberapa efek, dan pada tingkat signifikansi yang sangat kecil ini bisa menjadi sangat penting, karena itu akan menempatkan batas atas pada kekuatan yang kurang dari 1.μ0s∗/n−−√
Masalah kedua, mungkin lebih penting pada tingkat signifikansi 'umum', tampaknya pembilang dan penyebut statistik uji tidak lagi independen pada nol (kuadrat berkorelasi dengan estimasi varians) .x¯−μ
Ini berarti tes tidak lagi memiliki distribusi-t di bawah nol. Ini bukan kesalahan fatal, tetapi itu berarti Anda tidak bisa hanya menggunakan tabel dan mendapatkan tingkat signifikansi yang Anda inginkan (seperti yang akan kita lihat sebentar lagi). Artinya, tes menjadi konservatif dan ini berdampak pada kekuatan.
Ketika n menjadi besar, ketergantungan ini menjadi lebih sedikit masalah (paling tidak karena Anda dapat memanggil CLT untuk pembilang dan menggunakan teorema Slutsky untuk mengatakan daripada ada distribusi normal asimptotik untuk statistik yang dimodifikasi).
Berikut adalah kurva daya untuk dua sampel t biasa (kurva ungu, uji dua sisi) dan untuk tes menggunakan nilai nol dalam perhitungan (titik biru, diperoleh melalui simulasi, dan menggunakan t-tabel), seperti mean populasi bergerak menjauh dari nilai hipotesis, untuk :μ0sn=10
n = 10
Anda dapat melihat kurva daya lebih rendah (itu menjadi jauh lebih buruk pada ukuran sampel yang lebih rendah), tetapi banyak dari itu tampaknya karena ketergantungan antara pembilang dan penyebut telah menurunkan tingkat signifikansi. Jika Anda menyesuaikan nilai kritis dengan tepat, akan ada sedikit di antara mereka bahkan pada n = 10.
Dan ini kurva daya lagi, tapi sekarang untukn=30
n = 30
Ini menunjukkan bahwa pada ukuran sampel yang tidak kecil tidak ada banyak perbedaan di antara mereka, selama Anda tidak perlu menggunakan tingkat signifikansi yang sangat kecil.