Saat belajar untuk kursus statistik saya, saya mencoba memahami perbedaan antara tes hipotesis satu-ekor dan dua-ekor. Secara khusus, mengapa tes satu sisi menolak nol sedangkan yang dua sisi tidak?
Sebuah contoh:
Saat belajar untuk kursus statistik saya, saya mencoba memahami perbedaan antara tes hipotesis satu-ekor dan dua-ekor. Secara khusus, mengapa tes satu sisi menolak nol sedangkan yang dua sisi tidak?
Sebuah contoh:
Jawaban:
Tes tes dua sisi untuk perbedaan di kedua arah. Dengan demikian nilai P akan menjadi area di bawah distribusi t di sebelah kanan t = 1.92 PLUS area di bawah distribusi di sebelah kiri t = -1.92. Itu dua kali lebih luas dari tes satu sisi dan nilai P dua kali lebih besar.
Jika Anda menggunakan uji satu sisi, Anda memperoleh kekuatan, tetapi dengan biaya potensial karena harus mengabaikan perbedaan yang berlawanan dengan hipotesis sebelum data diperoleh. Jika Anda mendapatkan data sebelum Anda memformalkan dan mencatat hipotesis Anda benar-benar harus menggunakan tes dua sisi. Demikian pula, jika Anda akan tertarik pada efek di kedua arah Anda menggunakan tes dua sisi. Bahkan, Anda mungkin ingin menggunakan tes dua sisi sebagai pendekatan default Anda dan hanya menggunakan tes satu sisi dalam kasus yang tidak biasa di mana efek hanya bisa ada dalam satu arah.
Area di bawah kurva tidak dua kali lebih besar untuk tes dua sisi: Untuk tes dua sisi dengan kritis p = 0,05, Anda menguji seberapa sering data yang diamati dapat diambil dari 2,5% lebih rendah atau lebih tinggi dari distribusi nol ( 0,05 total). Dengan tes 1-ekor, Anda menguji seberapa sering data akan datang dari 5% ekor yang ekstrim dari satu (yang ditentukan sebelumnya).
Sebagian jawaban atas pertanyaan Anda adalah salah satu dari praktiknya: Sebagian besar peneliti melihat eksperimen yang melaporkan tes 1-ekor tidak mungkin ditiru (yaitu, mereka menganggap peneliti memilih ini untuk membuat statistik mereka menjadi "signifikan").
Namun ada kasus penggunaan yang valid. Jika Anda tahu bahwa hasil apa pun dalam arah sebaliknya tidak mungkin berdasarkan teori yang diuji, maka, seperti komentar sebelumnya dicatat, Anda dapat menentukan ini sebelumnya dan melakukan tes 1-tailed. Kebanyakan orang, sekali lagi, akan tetap melihat ini dengan saksama.
sedemikian sehingga jika statistik tersebut di wilayah ini, kita menolak nol. sekarang tingkat signifikansi dihitung sebagai probabilitas bahwa statistik berada di wilayah penolakan, ketika nol adalah benar.
Ini mengarah pada pertanyaan: mengapa menggunakan statistik uji yang berbeda? Alasannya adalah bahwa alternatifnya berbeda sehingga kekuatan masing-masing statistik uji berbeda. Secara khusus kekuatan setiap tes berkurang (asalkan kita menggunakan signifikansi yang sama) jika kita menggunakan statistik uji dan wilayah penolakan dari tes lain.