Perbedaan antara pengujian satu sisi dan dua sisi?


13

Saat belajar untuk kursus statistik saya, saya mencoba memahami perbedaan antara tes hipotesis satu-ekor dan dua-ekor. Secara khusus, mengapa tes satu sisi menolak nol sedangkan yang dua sisi tidak?

Sebuah contoh:

perbedaan antara tes hipotesis satu-ekor dan dua-ekor


Perhatikan bahwa Anda hanya menolak pada tingkat signifikansi yang ditentukan. Anda masih dapat menolak kedua hipotesis dengan menaikkan tingkat signifikansi menjadi 10%. Anda juga akan gagal menolak keduanya jika Anda menurunkan level signifikansi menjadi 1%.
probabilityislogic

Jawaban:


11

Tes tes dua sisi untuk perbedaan di kedua arah. Dengan demikian nilai P akan menjadi area di bawah distribusi t di sebelah kanan t = 1.92 PLUS area di bawah distribusi di sebelah kiri t = -1.92. Itu dua kali lebih luas dari tes satu sisi dan nilai P dua kali lebih besar.

Jika Anda menggunakan uji satu sisi, Anda memperoleh kekuatan, tetapi dengan biaya potensial karena harus mengabaikan perbedaan yang berlawanan dengan hipotesis sebelum data diperoleh. Jika Anda mendapatkan data sebelum Anda memformalkan dan mencatat hipotesis Anda benar-benar harus menggunakan tes dua sisi. Demikian pula, jika Anda akan tertarik pada efek di kedua arah Anda menggunakan tes dua sisi. Bahkan, Anda mungkin ingin menggunakan tes dua sisi sebagai pendekatan default Anda dan hanya menggunakan tes satu sisi dalam kasus yang tidak biasa di mana efek hanya bisa ada dalam satu arah.


Terima kasih atas komentar Anda, Michael. Inilah yang saya tidak mengerti: bagaimana bisa area di bawah kurva dua kali lebih besar untuk tes dua sisi? Bukankah P seharusnya sama dalam kedua kasus, karena alpha = 0,05?
Lu Ci

alpha, dalam pertanyaan Anda, hanyalah cutoff Anda untuk membuat keputusan tentang apa arti-p (tolak null atau tidak). Jadi, itu tidak mempengaruhi nilai p.
John

Agak pilih-pilih tetapi anggapan bahwa Anda perlu memilih hipotesis sebelum melihat data tidak perlu. Anda dapat melakukan dua tes satu sisi. Anda akan selalu menolak arah yang tidak disukai oleh data. Jadi masuk akal untuk pergi dengan uji satu sisi yang disukai oleh data.
probabilityislogic

1
@probabilityislogic -Saya setuju sepenuhnya, kecuali ketika seseorang ingin nilai alpha untuk mencerminkan tingkat kesalahan positif palsu jangka panjang yang sebenarnya (yaitu seseorang ingin menggunakan pendekatan Neyman-Pearson). Jika Anda menggunakan tes satu sisi dan memutuskan arah perubahan untuk menguji berdasarkan efek yang diamati maka Anda mendapatkan hasil positif palsu dua kali lebih banyak daripada tingkat alpha Anda.
Michael Lew

Ini hanya tingkat kesalahan jangka panjang bagi seseorang yang terus mengabaikan data sebelumnya. Ini bukan cara yang baik untuk mencapai kinerja jangka panjang yang baik. tingkat kesalahan yang diberikan oleh signifikansi adalah atas semua set data yang bisa kita amati satu kali .
probabilityislogic

5

Area di bawah kurva tidak dua kali lebih besar untuk tes dua sisi: Untuk tes dua sisi dengan kritis p = 0,05, Anda menguji seberapa sering data yang diamati dapat diambil dari 2,5% lebih rendah atau lebih tinggi dari distribusi nol ( 0,05 total). Dengan tes 1-ekor, Anda menguji seberapa sering data akan datang dari 5% ekor yang ekstrim dari satu (yang ditentukan sebelumnya).

Sebagian jawaban atas pertanyaan Anda adalah salah satu dari praktiknya: Sebagian besar peneliti melihat eksperimen yang melaporkan tes 1-ekor tidak mungkin ditiru (yaitu, mereka menganggap peneliti memilih ini untuk membuat statistik mereka menjadi "signifikan").

Namun ada kasus penggunaan yang valid. Jika Anda tahu bahwa hasil apa pun dalam arah sebaliknya tidak mungkin berdasarkan teori yang diuji, maka, seperti komentar sebelumnya dicatat, Anda dapat menentukan ini sebelumnya dan melakukan tes 1-tailed. Kebanyakan orang, sekali lagi, akan tetap melihat ini dengan saksama.


0

S(D)RR sedemikian sehingga jika statistik tersebut di wilayah ini, kita menolak nol. sekarang tingkat signifikansi dihitung sebagai probabilitas bahwa statistik berada di wilayah penolakan, ketika nol adalah benar.

S(D)=|t||t|>t0t0αS(D)=tt>t1t1Pr(|t|>t0|H0)Pr(t>t0|H0)t0t1

Ini mengarah pada pertanyaan: mengapa menggunakan statistik uji yang berbeda? Alasannya adalah bahwa alternatifnya berbeda sehingga kekuatan masing-masing statistik uji berbeda. Secara khusus kekuatan setiap tes berkurang (asalkan kita menggunakan signifikansi yang sama) jika kita menggunakan statistik uji dan wilayah penolakan dari tes lain.

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.