Bagaimana cara menguji hipotesis tidak ada perbedaan kelompok?


39

Bayangkan Anda memiliki studi dengan dua kelompok (misalnya, pria dan wanita) melihat variabel dependen numerik (misalnya, skor tes kecerdasan) dan Anda memiliki hipotesis bahwa tidak ada perbedaan kelompok.

Pertanyaan:

  • Apa cara yang baik untuk menguji apakah tidak ada perbedaan kelompok?
  • Bagaimana Anda menentukan ukuran sampel yang diperlukan untuk menguji secara memadai untuk tidak ada perbedaan kelompok?

Pikiran Awal:

  • Tidaklah cukup untuk melakukan uji-t standar karena kegagalan untuk menolak hipotesis nol tidak berarti bahwa parameter bunga sama atau mendekati nol; ini khususnya kasus dengan sampel kecil.
  • Saya bisa melihat pada interval kepercayaan 95% dan memeriksa bahwa semua nilai berada dalam kisaran yang cukup kecil; mungkin plus atau minus standar deviasi 0,3.

apa yang Anda maksud dengan "ini mengasumsikan hipotesis nol itu benar"?
robin girard

Jika Anda ingin dapat mengendalikan probabilitas menyatakan secara salah "ada perbedaan" Anda harus memisahkan dua hipotesis (apakah saya sudah menyebutkan saya suka kutipan ini: stats.stackexchange.com/questions/726/… ;))
robin girard

@Robin nilai p dari uji signifikansi hipotesis nol adalah probabilitas untuk melihat sebagai atau lebih data ekstrim daripada yang diamati dengan asumsi hipotesis nol benar; tapi mungkin saya bisa mengucapkan pernyataan di atas dengan lebih baik.
Jeromy Anglim

@Robin Saya memodifikasi pertanyaan untuk membuat poin saya lebih jelas
Jeromy Anglim

Jawaban:


20

Saya pikir Anda bertanya tentang pengujian kesetaraan . Pada dasarnya Anda perlu memutuskan seberapa besar perbedaan yang dapat diterima bagi Anda untuk tetap menyimpulkan bahwa kedua kelompok itu setara secara efektif. Keputusan itu mendefinisikan batas interval kepercayaan 95% (atau lainnya), dan perhitungan ukuran sampel dilakukan atas dasar ini.

Ada satu buku lengkap tentang topik ini.

"Uji" ekivalen klinis yang sangat umum adalah uji / uji coba non-inferioritas . Dalam hal ini Anda "lebih suka" satu kelompok daripada yang lain (pengobatan yang ditetapkan) dan merancang tes Anda untuk menunjukkan bahwa perawatan yang baru tidak kalah dengan perawatan yang ada pada beberapa tingkat bukti statistik.

Saya pikir saya perlu memberi kredit Harvey Motulsky untuk situs GraphPad.com (di bawah "Library" ).


16

Selain kemungkinan beberapa jenis sudah disebutkan tes kesetaraan , yang sebagian besar dari mereka, sepengetahuan saya, sebagian besar dialihkan dalam tradisi frequentist lama yang baik, ada kemungkinan melakukan tes yang benar-benar memberikan kuantifikasi bukti dalam nikmat dari nol-hipotesis, yaitu tes bayesian .

Implementasi uji-bayesian dapat ditemukan di sini: Wetzels, R., Raaijmakers, JGW, Jakab, E., & Wagenmakers, E.-J. (2009). Bagaimana mengukur dukungan untuk dan terhadap hipotesis nol: Implementasi WinBUGS yang fleksibel dari uji-t Bayesian default. Buletin & Ulasan Psikonomis, 16, 752-760.

Ada juga tutorial tentang cara melakukan semua ini di R:

http://www.ruudwetzels.com/index.php?src=SDtest


Alternatif (mungkin pendekatan yang lebih modern) dari uji-Bayesian disediakan (dengan kode) dalam makalah ini oleh Kruschke:

Kruschke, JK (2013). Estimasi Bayesian menggantikan uji t . Jurnal Psikologi Eksperimental: Umum , 142 (2), 573–603. doi: 10.1037 / a0029146


Semua alat peraga untuk jawaban ini (sebelum penambahan Kruschke) harus diberikan kepada kolega saya David Kellen. Saya mencuri jawabannya dari pertanyaan ini .


Saya bertanya-tanya apakah seseorang akan memberikan pendekatan Bayesian. Luar biasa. Terima kasih.
Jeromy Anglim

1
Mungkin perlu memperbarui jawaban ini untuk memasukkan referensi ke paket BayesFactor yang luar biasa untuk R.
crsh


8

Ada beberapa makalah yang saya tahu dapat membantu Anda:

Tryon, WW (2001). Mengevaluasi perbedaan statistik, ekuivalensi, dan ketidakpastian dengan menggunakan interval kepercayaan inferensial: Metode alternatif yang terintegrasi untuk melakukan uji statistik hipotesis nol. Metode Psikologis, 6, 371-386. ( PDF GRATIS )

Dan koreksi:
Tryon, WW, & Lewis, C. (2008). Metode Interval Keyakinan Inferensi untuk Membangun Kesetaraan Statistik Yang Mengoreksi Faktor Pengurangan Tryon (2001). Metode Psikologis, 13, 272-278. ( PDF GRATIS )

Selanjutnya:

Seaman, MA & Serlin, RC (1998). E interval kepercayaan quivalence untuk perbandingan dua kelompok berarti . Metode Psikologis, Vol 3 (4), 403-411.


Ada banyak makalah dan bahkan buku tentang topik ini.
Michael R. Chernick

7

Baru-baru ini saya memikirkan cara alternatif "pengujian ekivalensi" berdasarkan jarak antara dua distribusi dan bukan antara artinya.

Ada beberapa metode yang memberikan interval kepercayaan untuk tumpang tindih dari dua distribusi Gaussian:enter image description here

O(P1,P2)P1P2

1O(P1,P2)=TV(P1,P2)
TV(P1,P2)=supA|P1(A)P2(A)|P1P2

O(P1,P2)>0.9P1P20.110%

μ1μ2

|μ1μ2|TV(P1,P2)

|μ1μ2|σ


Apakah Anda memiliki sumber daya yang menunjukkan tumpang tindih yang digunakan dalam beberapa masalah nyata? Ini kedengarannya sangat menjanjikan, tetapi tidak jelas bagi saya bagaimana orang akan menerapkannya dalam masalah nyata (di mana kesimpulan Anda berpotensi beberapa langkah dihapus dari "distribusi ini sangat mirip dengan X", sehingga membuatnya agak sulit untuk melihat bagaimana hal itu terjadi. 10% TV diterjemahkan ke dalam ukuran dampak pada kesimpulan).
Stumpy Joe Pete

1
@StumpyJoePete Saya telah menulis sesuatu dengan semangat yang sama di blog saya: stla.github.io/stlapblog/posts/…
Stéphane Laurent

5

Dalam ilmu kedokteran, lebih baik menggunakan pendekatan interval kepercayaan dibandingkan dengan dua tes satu sisi (tost). Saya juga merekomendasikan grafik perkiraan titik, CI, dan margin kesetaraan yang ditentukan secara apriori untuk memperjelas hal-hal tersebut.

Pertanyaan Anda kemungkinan akan ditanggapi dengan pendekatan semacam itu.

Pedoman CONSORT untuk studi non-inferioritas / kesetaraan cukup berguna dalam hal ini.

Lihat Piaggio G, Elbourne DR, Altman DG, Pocock SJ, Evans SJ, dan CONSORT Group. Pelaporan uji coba acak non-inferioritas dan ekivalensi: perpanjangan pernyataan CONSORT. JAMA. 2006, 8 Maret 295 (10): 1152-60. (Tautan ke teks lengkap.)


1
Saya tidak perlu mengatakan bahwa interval kepercayaan lebih disukai. Bahkan interval kepercayaan sesuai dengan tes hipotesis. TOST dapat dicapai dengan melihat interval kepercayaan yang diperoleh dengan memotong dua interval kepercayaan satu sisi yang sesuai dengan dua tes satu sisi yang digunakan dalam prosedur.
Michael R. Chernick

4

Iya nih. Ini adalah pengujian kesetaraan. Pada dasarnya Anda membalikkan hipotesis nol dan alternatif dan mendasarkan ukuran sampel pada kekuatan untuk menunjukkan bahwa perbedaan rata-rata ada di dalam jendela kesetaraan. Blackwelder menyebutnya "Membuktikan hipotesis nol." Ini biasanya dilakukan dalam uji klinis farmasi di mana kesetaraan obat generik dengan obat yang dipasarkan diuji atau obat yang disetujui dibandingkan dengan formulasi baru (sering disebut bioequivalence). Versi satu sisi disebut non-inferiority. Beberapa kali suatu obat dapat disetujui hanya dengan menunjukkan bahwa obat baru itu tidak kalah dengan pesaing yang dipasarkan. Shao dan Pigeot telah mengembangkan pendekatan bootstrap yang konsisten untuk bioekivalensi menggunakan desain crossover.


Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.