Hubungan antara tes omnibus dan beberapa perbandingan?


8

Wikipedia mengatakan

Metode yang mengandalkan tes omnibus sebelum melanjutkan ke beberapa perbandingan . Biasanya metode ini memerlukan uji rentang ANOVA / Tukey yang signifikan sebelum melanjutkan ke beberapa perbandingan. Metode ini memiliki kontrol "lemah" kesalahan Tipe I.

Juga

Uji-F dalam ANOVA adalah contoh uji omnibus, yang menguji signifikansi keseluruhan model. Uji F signifikan berarti bahwa di antara rata-rata yang diuji, setidaknya dua dari rata-rata berbeda secara signifikan, tetapi hasil ini tidak menentukan secara pasti apa yang berarti satu berbeda dari yang lain. Sebenarnya, pengujian berarti 'perbedaan telah dibuat oleh statistik F kuadratik rasional (F = MSB / MSW). Untuk menentukan rerata mana yang berbeda dari rerata lain atau yang kontras rerata berbeda secara signifikan, uji Post Hoc (uji Perbandingan Berganda) atau tes terencana harus dilakukan setelah mendapatkan uji F omnibus yang signifikan. Mungkin mempertimbangkan untuk menggunakan koreksi Bonferroni sederhana atau koreksi lain yang sesuai.

Jadi tes omnibus digunakan untuk menguji signifikansi keseluruhan, sedangkan beberapa perbandingan adalah untuk menemukan perbedaan mana yang signifikan.

Tetapi jika saya mengerti dengan benar, tujuan utama dari beberapa perbandingan adalah untuk menguji signifikansi keseluruhan, dan juga dapat menemukan perbedaan mana yang signifikan. Dengan kata lain, beberapa perbandingan dapat melakukan apa yang bisa dilakukan oleh omnibus. Lalu mengapa kita perlu tes omnibus?

Jawaban:


7

Tujuan dari beberapa prosedur perbandingan bukan untuk menguji signifikansi keseluruhan, tetapi untuk menguji efek individu untuk signifikansi sambil mengendalikan tingkat kesalahan eksperimental. Sangat mungkin untuk misalnya uji-omnibus menjadi signifikan pada tingkat tertentu sementara tidak ada tes Tukey berpasangan-itu dibahas di sini & di sini .

Pertimbangkan contoh yang sangat sederhana: menguji apakah dua varian normal independen dengan varians unit keduanya memiliki nol, sehingga

H0:μ1=0μ2=0
H1:μ10μ20

Tes # 1: tolak ketika

X12+X22Fχ221(1α)

Tes # 2: tolak ketika

|X1||X2|FN1(111α2)

(menggunakan koreksi Sidak untuk mempertahankan ukuran keseluruhan). Kedua pengujian memiliki ukuran yang sama ( ) tetapi wilayah penolakan yang berbeda:α

Plot wilayah penolakan

Tes # 1 adalah tes omnibus yang khas: lebih kuat daripada Tes # 2 ketika kedua efeknya besar tetapi tidak ada yang terlalu besar. Tes # 2 adalah uji perbandingan ganda tipikal: lebih kuat daripada Uji # 1 ketika salah satu efek besar & kecil lainnya, & juga memungkinkan pengujian independen dari masing-masing komponen nol global.

Jadi dua prosedur pengujian yang valid yang mengontrol tingkat kesalahan eksperimental di adalah ini:α

(1) Lakukan Uji # 1 & baik (a) jangan menolak global null, atau (b) menolak global null, maka (& hanya dalam kasus ini) melakukan Uji # 2 & salah satu (i) menolak komponen, (ii) menolak komponen pertama, (ii) menolak komponen kedua, atau (iv) menolak kedua komponen.

(2) Lakukan hanya Uji # 2 & salah satu (a) menolak komponen (sehingga gagal menolak global null), (b) menolak komponen pertama (dengan demikian juga menolak global null), (c) menolak komponen kedua ( dengan demikian juga menolak global null), atau (d) menolak kedua komponen (dengan demikian juga menolak global null).

Anda tidak dapat memiliki kue & memakannya dengan melakukan Uji # 1 & tidak menolak nol global, namun masih akan melakukan Uji # 2: tingkat kesalahan Tipe I lebih besar dari untuk prosedur ini.α


Terima kasih! (1) Bukankah global null ditolak jika dan hanya jika ada setidaknya satu individu nol ditolak? Jadi beberapa prosedur perbandingan dapat menguji null global, yaitu keseluruhan signifikansi? (2) "tetapi hanya untuk menguji efek individu untuk signifikansi sambil mengendalikan tingkat kesalahan eksperimental", apakah Anda bermaksud bahwa beberapa prosedur perbandingan dapat mengidentifikasi nol individu mana yang ditolak ketika global nol ditolak?
Tim

2
(1) Itu benar jika Anda mencoret 'dan hanya jika'. Poirot bisa yakin ada pembunuh di Orient Express tanpa yakin siapa itu. (Tapi saya harus menghapus ' satu - satunya ' dari jawaban saya) (2) Ya.
Scortchi

Terima kasih! Dalam (1), "jika Anda mencoret 'dan hanya jika'", apakah maksud Anda bahwa beberapa prosedur perbandingan dapat digunakan untuk menguji nol global, tetapi itu membuat kesalahan negatif yang lebih salah daripada tes omnibus?
Tim

Tingkat kesalahan negatif palsu tergantung pada bagaimana nol itu salah. Lihat contoh yang saya tambahkan.
Scortchi

1

Saat menguji m hipotesis, ada kombinasi hipotesis yang dapat diuji. Salah satunya adalah hipotesis "nol global", alias "hipotesis persimpangan": .2mHi0

Tes omnibus biasanya nama untuk menguji hipotesis nol global. Persyaratan minimum yang jelas dari prosedur pengujian berganda, adalah kontrol kesalahan di bawah global null. Ini dikenal sebagai kontrol "FWER lemah". Tetapi Anda mungkin tidak akan berhenti sampai di situ - untuk tujuan inferensi pada hipotesis tertentu, Anda akan menginginkan prosedur yang menawarkan kontrol FWER di bawah kombinasi nol sejati apa pun. Ini dikenal sebagai kontrol "FWER kuat".


Bisakah Anda mengatakan sedikit tentang angka itu? Dengan grup, seseorang memiliki perbandingan multipel berpasangan maksimum yang mungkin, dan angka + 1 untuk tes omnibus ... Apakah Anda termasuk semua yang mungkin (mis. Pasangan <tiga kali lipat < tes -ukuran)? 2mkk(k1)/2k
Alexis

Saya pikir apa yang dimaksud oleh JohnRos adalah bahwa ada 2 ^ m kemungkinan kombinasi dari hipotesis nol benar / salah. Misalnya, jika ada 3 hipotesis nol dan masing-masing bisa benar (T) atau salah (F), maka ada 2 ^ 3 = 8 skenario yang mungkin: TTT, TTF, TFT, TFF, FTT, FTF, FFT, FFF . Bagaimana itu relevan, saya tidak yakin, karena untuk beberapa perbandingan kami tertarik pada jumlah tes (yaitu 3), bukan jumlah kombinasi unik dari Ts dan Fs.
Bonferroni

1

Selain perhitungan yang terkait dengan tes Pair-Wise, ada hal lain mengapa ANOVA digunakan daripada melakukan semua tes PAIR-WISE.

Kadang-kadang, ada kemungkinan bahwa sementara ANOVA menolak hipotesis nol bahwa semua populasi berarti sama pada tingkat kepercayaan tertentu, namun jika Anda mengambil semua tes pasangan-bijaksana (katakanlah LSD) Anda mungkin tidak menemukan bahkan setidaknya satu pasangan cara yang melebihi perbedaan pada tingkat kepercayaan itu.

Bukti matematis untuk pernyataan di atas, dengan mempertimbangkan tes LSD FISHER'S

masukkan deskripsi gambar di sini di sini: adalah standar deviasi dalam kotak.Sp

Ambil kasing, ketika kami memiliki grup, maka, kami memiliki tes pasangan .NN(N1)/2

Jumlahkan semua tes :N(N1)/2

Setelah membaginya dengan (seperti DoF) dan mengkuadratkan di kedua sisi:(N1)

pada LHS, kami mendapatkan jumlah yang sama dengan yang digunakan di ANOVA; Namun, pada RHS, kami mendapatkan Statistik Uji * ANOVA.N/2

Jadi, bahkan jika semua tes LSD pasangan-bijaksana bersama-sama tidak dapat menolak hipotesis nol, masih ada peluang bagus bahwa ANOVA dapat menolak hipotesis nol.

Oleh karena itu, ANOVA mengandung lebih banyak informasi daripada semua tes bijaksana yang dipertimbangkan bersama-sama.

PS: Permintaan maaf karena menggunakan gambar alih-alih mengetik persamaan.

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.