Cara menentukan hipotesis nol dalam pengujian hipotesis


15

Apa aturan praktis yang baik untuk bagaimana memilih pertanyaan untuk hipotesis nol. Misalnya, jika saya ingin memeriksa apakah hipotesis B benar, haruskah saya menggunakan B sebagai nol, B sebagai hipotesis alternatif, atau B bukan sebagai nol? Saya harap pertanyaannya jelas. Saya tahu bahwa ini ada hubungannya dengan kesalahan yang ingin saya perkecil (Tipe I?), Tetapi saya terus lupa bagaimana kelanjutannya, karena saya tidak memiliki intuisi yang jelas untuk itu. Terima kasih.


Guys ... tanggapan yang sangat baik. Semua bermanfaat. Itu masih mengejutkan saya ketika saya mendapatkan tingkat kolaborasi ini di web, hanya karena orang-orang tertarik. Wow terima kasih !
Nestor

Jawaban:


17

Aturan praktis dari penasihat saya yang baik adalah mengatur Null-Hipotesis untuk hasil yang Anda tidak ingin benar yaitu hasil yang berlawanan langsung yang ingin Anda tunjukkan.

Contoh dasar: Misalkan Anda telah mengembangkan perawatan medis baru dan Anda ingin menunjukkan bahwa itu memang lebih baik daripada plasebo. Jadi Anda menetapkan Null-Hipotesis treament baru sama atau lebih buruk daripada plasebo dan Hipotesis Alternatif H 1 : = pengobatan baru lebih baik daripada plasebo.H0:=H1:=

Ini karena dalam perjalanan uji statistik Anda menolak Hipotesis Null (dan mendukung Hipotesis Alternatif) atau Anda tidak dapat menolaknya. Karena "tujuan" Anda adalah menolak Null-Hipotesis, Anda menetapkannya pada hasil yang tidak Anda inginkan benar.

Catatan Sisi: Saya sadar bahwa seseorang seharusnya tidak membuat tes statistik untuk memelintirnya dan memecahnya sampai Null-Hipotesis ditolak, bahasa biasa hanya digunakan untuk membuat aturan ini lebih mudah diingat.

Ini juga dapat membantu: Apa arti dari nilai p dan nilai t dalam uji statistik? dan / atau Apa pengantar yang baik untuk pengujian hipotesis statistik untuk para ilmuwan komputer?


6

Jika hipotesis B adalah hipotesis menarik, Anda dapat menganggap tidak-B sebagai hipotesis nol dan mengendalikan, di bawah nol, probabilitas kesalahan tipe I untuk menolak not-B pada level . Menolak not-B kemudian diartikan sebagai bukti yang mendukung B karena kita mengendalikan kesalahan tipe I, oleh karena itu tidak mungkin bahwa not-B benar. Bingung ... ? α

Ambil contoh pengobatan vs tanpa perawatan dalam dua kelompok dari suatu populasi. Hipotesis yang menarik adalah bahwa pengobatan memiliki efek, yaitu, ada perbedaan antara kelompok yang diobati dan kelompok yang tidak diobati karena perlakuan. Hipotesis nol adalah bahwa tidak ada perbedaan, dan kami mengontrol kemungkinan salah menolak hipotesis ini. Dengan demikian kami mengontrol kemungkinan salah menyimpulkan bahwa ada efek pengobatan ketika tidak ada efek pengobatan. Kesalahan tipe II adalah probabilitas salah menerima nol ketika ada efek pengobatan.

Formulasi di atas didasarkan pada kerangka Neyman-Pearson untuk pengujian statistik, di mana pengujian statistik dipandang sebagai masalah keputusan antara untuk kasus, nol dan alternatif. Level adalah fraksi kali kita membuat kesalahan tipe I jika kita (secara independen) mengulangi tes. Dalam kerangka kerja ini benar-benar tidak ada perbedaan formal antara nol dan alternatif. Jika kita menukar nol dan alternatif, kita menukar probabilitas kesalahan tipe I dan tipe II. Kami tidak, bagaimanapun, mengontrol probabilitas kesalahan tipe II di atas (tergantung pada seberapa besar efek pengobatan), dan karena asimetri ini, kami mungkin lebih suka mengatakan bahwa kami gagal menolakαhipotesis nol (alih-alih kami menerima hipotesis nol). Jadi kita harus berhati-hati dalam menyimpulkan bahwa hipotesis nol itu benar hanya karena kita tidak dapat menolaknya.

ppppp-nilai tidak perlu dibenarkan oleh sejumlah keputusan (imajiner) berulang.

Tidak ada kerangka kerja yang tanpa masalah, dan terminologinya sering membingungkan. Saya dapat merekomendasikan buku Bukti statistik: paradigma kemungkinan oleh Richard M. Royall untuk perawatan yang jelas dari berbagai konsep.


5

Respons "frequentist" adalah untuk menciptakan hipotesis nol dari bentuk "bukan B" dan kemudian menentang "bukan B", seperti dalam respons Steffen. Ini adalah padanan logis dari membuat argumen "Anda salah, karena itu saya pasti benar". Ini adalah jenis penggunaan alasan politisi (yaitu pihak lain itu buruk, oleh karena itu kami baik). Cukup sulit untuk berurusan dengan lebih dari 1 alternatif dengan alasan seperti ini. Ini karena argumen "Anda salah, karena itu saya benar" hanya masuk akal ketika keduanya tidak mungkin salah, yang tentu saja dapat terjadi ketika ada lebih dari satu hipotesis alternatif.

Respons "Bayesian" adalah menghitung probabilitas hipotesis yang Anda minati, bergantung pada bukti apa pun yang Anda miliki. Selalu ini berisi informasi sebelumnya, yang hanya merupakan asumsi yang telah Anda buat untuk membuat masalah Anda dengan baik (semua prosedur statistik bergantung pada informasi sebelumnya, prosedur Bayesian membuatnya lebih eksplisit). Itu juga biasanya terdiri dari beberapa data, dan kita miliki dengan bayes theorem

P(H0|DI)=P(H0|I)P(D|H0I)kP(Hk|I)P(D|HkI)

H0H0adalah "alternatif". Hanya konotasi yang tersirat oleh kata "null" dan "alternative" yang membuatnya tampak berbeda. Anda dapat menunjukkan kesetaraan dalam kasus "Neyman Pearson Lemma" ketika ada dua hipotesis, karena ini hanyalah rasio kemungkinan, yang diberikan sekaligus dengan mengambil peluang dari teorema bayes di atas:

P(H0|DI)P(H1|DI)=P(H0|I)P(H1|I)×P(D|H0I)P(D|H1I)=P(H0|I)P(H1|I)×Λ

H0Λ>Λ~Λ~H1L2L1L1L2

Λ1<Λ~1


3
Paragraf pertama itu adalah parodi dari pendekatan klasik untuk pengujian hipotesis.
whuber

Pengujian hipotesis tidak selalu soal membuat keputusan. Ini sering dirumuskan seperti itu, tetapi dalam sains pertanyaannya mungkin untuk mendokumentasikan bahwa nol itu salah dan seberapa banyak. Saya melihat kata bermain game sebagai pengingat tujuan ini. Dari sudut pandang ini, gagal untuk menolak bukanlah keputusan untuk menerima tetapi kurangnya bukti dalam data untuk menolak.
NRH

@NRH - Saya setuju, tapi itu tidak selalu tujuannya. Jika Anda ingin menguji teori baru, Anda ingin tahu seberapa besar kemungkinannya itu benar, sama seperti Anda ingin tahu seberapa besar kemungkinannya itu salah. Dan meskipun tes hipotesis tidak selalu secara langsung mengarah pada keputusan, sepertinya membuang-buang waktu untuk mengujinya jika akhirnya tidak mengarah pada keputusan. Anda sebenarnya sudah merumuskan keputusan dalam komentar Anda: "bertindak seolah-olah nol itu salah". Hanya ada satu alternatif untuk ini: "bertindak seolah-olah nol benar". Jika ada lebih dari satu alternatif, maka hipotesisnya ...
probabilityislogic

(cont'd) .. tes belum didefinisikan dengan baik, dan "secara matematis salah" sehingga untuk berbicara. Mungkin ada ketidakpastian besar tentang keputusan ini, tetapi tidak ada alternatif lain, nol tidak bisa tidak benar dan tidak salah pada saat yang sama, kecuali jika Anda memiliki masalah keliru / ambigu. Tetapi dalam hal ini pengujian hipotesis tidak ada gunanya - tidak ada kesimpulan yang tepat.
probabilityislogic

(melanjutkan kata-kata kasar) - dan jika tujuannya adalah untuk hanya mengukur bukti terhadap nol, maka Anda tidak perlu tes hipotesis. Ini adalah nilai p untuk - Anda tidak perlu menerima atau menolak, cukup laporkan nilainya.
probabilityislogic

1

Hipotesis nol umumnya harus mengasumsikan bahwa perbedaan dalam variabel respons disebabkan oleh kesalahan saja.

AxH0Ax

Gagal menolak hipotesis nol ini akan ditafsirkan sebagai:

1) ada perbedaan xkarena kesalahan sendiri dan tidak Aatau,

2) bahwa data tidak memadai untuk mendeteksi perbedaan meskipun ada (lihat kesalahan Tipe 2 di bawah).

HaAx

H0AxH0Ax


1
Paragraf ketiga tampaknya menyiratkan bahwa kegagalan untuk menolak nol berarti nol itu benar, tetapi jelas itu salah: alternatifnya bisa benar (dan biasanya adalah), tetapi tidak cukup berbeda dari nol untuk dideteksi dengan data yang diberikan.
whuber

@whuber - poin bagus, saya akan mengedit jawaban untuk mencerminkan ini
DQdlM
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.