Pembenaran pengujian hipotesis satu sisi


35

Saya mengerti pengujian hipotesis dua sisi. Anda memiliki (vs. ). Nilai adalah probabilitas bahwa menghasilkan data setidaknya sama ekstrimnya dengan apa yang diamati.H0:θ=θ0H1=¬H0:θθ0pθ

Saya tidak mengerti pengujian hipotesis satu sisi. Di sini, (vs. ). Definisi nilai-p seharusnya tidak berubah dari atas: itu harus tetap menjadi probabilitas bahwa menghasilkan data setidaknya sama ekstrimnya dengan apa yang diamati. Tapi kita tidak tahu , hanya itu dibatasi oleh .H0:θθ0H1=¬H0:θ>θ0θ θθ0

Jadi sebagai gantinya, saya melihat teks mengatakan kepada kami untuk berasumsi bahwa (bukan sesuai ) dan menghitung probabilitas bahwa ini menghasilkan data setidaknya sama ekstrimnya dengan apa yang diamati, tetapi hanya pada satu ujung . Ini tampaknya tidak ada hubungannya dengan hipotesis, secara teknis.θ=θ0θθ0H0

Sekarang, saya mengerti bahwa ini adalah pengujian hipotesis frequentist, dan frequentist tidak menempatkan prior pada mereka . Tetapi bukankah seharusnya itu hanya berarti bahwa hipotesis tidak mungkin diterima atau ditolak, alih-alih memasukkan perhitungan di atas ke dalam gambar?θ


Pertanyaan serupa diajukan sesudahnya stats.stackexchange.com/questions/8196/…
robin

1
Definisi Anda tentang -value tidak lengkap. Itu harus membaca (penekanan ditambahkan): Nilai- p adalah probabilitas bahwa θ menghasilkan data setidaknya sama ekstrim dengan apa yang diamati, dengan asumsi hipotesis nol adalah benar . ppθ
Alexis

Jawaban:


34

Itu pertanyaan yang masuk akal. Banyak teks (mungkin karena alasan pedagogis) yang membahas masalah ini. Apa yang sebenarnya terjadi adalah bahwa adalah komposit "hipotesis" dalam situasi satu sisi Anda: itu sebenarnya seperangkat hipotesis, tidak satu pun. Hal ini diperlukan bahwa untuk setiap hipotesis mungkin dalam H 0H0 H0, kemungkinan statistik uji jatuh di wilayah kritis harus kurang dari atau sama dengan ukuran tes. Selain itu, jika tes sebenarnya untuk mencapai ukuran nominalnya (yang merupakan hal yang baik untuk mencapai daya tinggi), maka supremum peluang ini (diambil alih semua hipotesis nol) harus sama dengan ukuran nominal. Dalam praktiknya, untuk pengujian satu parameter sederhana dari lokasi yang melibatkan keluarga distribusi "baik" tertentu, supremum ini diperoleh untuk hipotesis dengan parameter . Dengan demikian, sebagai masalah praktis, semua perhitungan berfokus pada distribusi yang satu ini. Tapi kita tidak boleh melupakan sisa set H 0θ0H0: itu adalah perbedaan penting antara tes dua sisi dan satu sisi (dan antara tes "sederhana" dan "komposit" secara umum).

Ini secara halus mempengaruhi interpretasi hasil tes satu sisi. Ketika nol ditolak, kita dapat mengatakan bukti menunjuk pada keadaan sebenarnya dari setiap distribusi di . Ketika nol tidak ditolak, kita hanya bisa mengatakan ada distribusi dalam H 0 yang "konsisten" dengan data yang diamati. Kami tidak mengatakan bahwa semua distribusi di H 0 konsisten dengan data: jauh dari itu! Banyak dari mereka mungkin menghasilkan kemungkinan yang sangat rendah.H0H0H0


Semua yang Anda katakan valid dan penting. Aspek penting lainnya yang saya pikir adalah bahwa biasanya hipotesis nol dipandang sebagai hipotesis yang tidak menarik. Alternatif tersebut dipandang sebagai hipotesis ilmiah. Itu yang ingin dibuktikan oleh pelaku eksperimen. Saya katakan biasanya karena berbeda dalam tes ekivalensi dan non-inferioritas. Sekarang mengenai masalah pengujian satu sisi itu hanya mengatakan sisi yang memiliki parameter lebih besar daripada nilai nol yang menarik. Jadi semua nilai di sisi yang kurang dimasukkan ke dalam nol.
Michael R. Chernick

stats.stackexchange.com/questions/333301/… Jika Anda merasa ingin memberikan jawaban untuk pertanyaan ini, atau mengarahkan saya ke beberapa daftar pustaka ...;)
Seorang lelaki tua di laut.


2

Anda akan menggunakan uji hipotesis satu sisi jika hanya hasil dalam satu arah yang mendukung kesimpulan yang ingin Anda capai.

Pikirkan ini dalam hal pertanyaan yang Anda ajukan. Misalkan, misalnya, Anda ingin melihat apakah obesitas menyebabkan peningkatan risiko serangan jantung. Anda mengumpulkan data Anda, yang mungkin terdiri dari 10 orang gemuk dan 10 orang tidak gemuk. Sekarang katakanlah, karena faktor pembaur yang tidak tercatat, desain eksperimental yang buruk, atau nasib buruk, Anda mengamati bahwa hanya 2 dari 10 orang gemuk mengalami serangan jantung, dibandingkan dengan 8 orang yang tidak gemuk.

Sekarang jika Anda melakukan tes hipotesis 2-sisi pada data ini, Anda akan menyimpulkan bahwa ada hubungan yang signifikan secara statistik (p ~ 0,02) antara obesitas dan risiko serangan jantung. Namun, asosiasi akan berada di arah yang berlawanan dengan apa yang sebenarnya Anda harapkan untuk dilihat, maka hasil tes akan menyesatkan.

(Dalam kehidupan nyata, percobaan yang menghasilkan hasil yang berlawanan dengan intuisi dapat menimbulkan pertanyaan lebih lanjut yang menarik dalam diri mereka sendiri: misalnya, proses pengumpulan data mungkin perlu ditingkatkan, atau mungkin ada faktor risiko yang sebelumnya tidak diketahui di tempat kerja, atau mungkin kebijaksanaan konvensional hanya keliru. Tetapi masalah ini tidak benar-benar terkait dengan pertanyaan sempit tentang tes hipotesis seperti apa yang digunakan.)


2

pH0H00.5H10.5

H0H00.75H10.25

H1H0H0

Anda dapat bereksperimen dengan contoh mainan ini di R sendiri, Anda juga harus mencoba angka absolut dan kombinasi kepala dan ekor yang berbeda:

> binom.test(2,2,alternative="two.sided")

    Exact binomial test

data:  2 and 2
number of successes = 2, number of trials = 2, p-value = 0.5
alternative hypothesis: true probability of success is not equal to 0.5
95 percent confidence interval:
 0.1581139 1.0000000
sample estimates:
probability of success 
                     1

> binom.test(2,2,alternative="greater")

    Exact binomial test

data:  2 and 2
number of successes = 2, number of trials = 2, p-value = 0.25
alternative hypothesis: true probability of success is greater than 0.5
95 percent confidence interval:
 0.2236068 1.0000000
sample estimates:
probability of success 
                     1 
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.