Mengapa kita menggunakan uji satu arah uji-F dalam analisis varian (ANOVA)?

Bisakah Anda memberi alasan untuk menggunakan uji satu arah dalam analisis uji varians?

Mengapa kita menggunakan uji satu sisi - uji F - di ANOVA?

— Cynderella
sumber

Beberapa pertanyaan untuk memandu pemikiran Anda ... Apa arti statistik t yang sangat negatif? Apakah statistik F negatif mungkin? Apa yang dimaksud dengan statistik F sangat rendah? Apa yang dimaksud dengan statistik F tinggi?

— russellpierce

Mengapa Anda mendapat kesan bahwa tes satu-ekor haruslah menjadi F-Test? Untuk menjawab pertanyaan Anda: F-Test memungkinkan untuk menguji hipotesis dengan lebih dari satu kombinasi linear dari parameter.

— IMA

Apakah Anda ingin tahu mengapa seseorang akan menggunakan tes satu sisi dan bukan dua sisi?

— Jens Kouros

@tree apa yang merupakan sumber resmi atau kredibel untuk tujuan Anda?

— Glen_b -Reinstate Monica

@tree mencatat bahwa pertanyaan Cynderella di sini bukan tentang uji varian, tetapi secara khusus uji-F ANOVA - yang merupakan tes untuk persamaan cara . Jika Anda tertarik pada pengujian kesetaraan varian, itu sudah dibahas dalam banyak pertanyaan lain di situs ini. (Untuk uji varians, ya, Anda benar-benar peduli pada kedua ekor, seperti yang dijelaskan dengan jelas dalam kalimat terakhir bagian ini , tepat di atas ' Properti ')

— Glen_b -Reinstate Monica

Jawaban:

Tes F paling umum digunakan untuk dua tujuan:

dalam ANOVA, untuk menguji persamaan cara (dan berbagai analisis serupa); dan
dalam menguji persamaan varian

Mari kita pertimbangkan masing-masing:

1) Uji F dalam ANOVA (dan juga, jenis uji chi-square yang biasa untuk data hitung) dibangun sehingga semakin banyak data yang konsisten dengan hipotesis alternatif, semakin besar statistik uji cenderung, sedangkan pengaturan sampel data yang terlihat paling konsisten dengan nol sesuai dengan nilai terkecil dari statistik uji.

Pertimbangkan tiga sampel (ukuran 10, dengan varians sampel yang sama), dan atur agar memiliki rata-rata sampel yang sama, dan kemudian gerakkan sarana mereka dalam pola yang berbeda. Karena variasi dalam sampel berarti meningkat dari nol, statistik F menjadi lebih besar:

Pengaturan 3 sampel dan statistik F yang sesuai

Garis hitam () adalah nilai data. Garis merah berat ( ) adalah sarana grup. $^{\:_|}$ $\color{red}{\mathbf{|}}$

Jika hipotesis nol (persamaan rata-rata populasi) benar, Anda akan mengharapkan beberapa variasi dalam mean sampel, dan biasanya akan mengharapkan untuk melihat rasio F secara kasar sekitar 1. Statistik F yang lebih kecil dihasilkan dari sampel yang lebih berdekatan daripada yang biasanya Anda lakukan. harapkan ... jadi Anda tidak akan menyimpulkan populasi berarti berbeda.

Yaitu, untuk ANOVA, Anda akan menolak hipotesis kesetaraan sarana ketika Anda mendapatkan nilai-F yang luar biasa besar dan Anda tidak akan menolak hipotesis kesetaraan sarana ketika Anda mendapatkan nilai-nilai kecil yang tidak biasa (ini mungkin mengindikasikan sesuatu , tetapi tidak bahwa populasi berarti berbeda).

Berikut ini ilustrasi yang mungkin membantu Anda melihat bahwa kami hanya ingin menolak ketika F berada di ekor atasnya:

2) Tes F untuk kesetaraan varians * (berdasarkan rasio varians). Di sini, rasio dari dua perkiraan varians sampel akan besar jika varians sampel pembilang jauh lebih besar dari varians dalam penyebut, dan rasio akan menjadi kecil jika varians sampel penyebut jauh lebih besar dari varians dalam pembilang.

Yaitu, untuk menguji apakah rasio varians populasi berbeda dari 1, Anda ingin menolak nol untuk nilai F. besar dan kecil

* (Mengesampingkan masalah sensitivitas tinggi terhadap asumsi distribusi tes ini (ada alternatif yang lebih baik) dan juga masalah bahwa jika Anda tertarik pada kesesuaian asumsi varian sama ANOVA, strategi terbaik Anda mungkin bukan tes formal.)

— Glen_b -Reinstate Monica
sumber

Tes @TaylerJones Levene agak lebih kuat. Browne-Forsythe lebih kuat (tetapi kehilangan sedikit daya di dekat normal). Fligner-Killeen lagi. Dalam beberapa dekade, saya menggunakan Levene atau Browne-Forsy masing-masing tidak lebih dari dua kali. (Jika itu muncul lagi, kemungkinan sesuatu seperti Browne-Forsythe akan cocok untuk saya baik-baik saja tetapi saya biasanya tidak memiliki situasi di mana masuk akal untuk menguji beberapa varian kelompok untuk kesetaraan.)

— Glen_b -Reinstate Monica

F = \frac{M S_{T R E A T M E N T}}{M S_{E R R O R}}

$F=\frac{MS_{TREATMENT}}{MS_{ERROR}}$

1

$1$

F

$F$

@tree Kedengarannya seperti Anda tidak mengerti sesuatu tentang pengujian hipotesis lebih umum, tetapi sulit untuk memastikan di mana tepatnya. Anda mengatakan Anda mengerti bahwa jika Anda mendapat nilai F besar, Anda ingin menolak dan jika Anda mendapatkan nilai F kecil, Anda tidak ingin menolak. Nilai-nilai besar F adalah nilai-nilai di ekor atas sementara nilai-nilai kecil F adalah nilai-nilai di ekor bawah. Anda hanya ingin menolak ketika nilainya besar ... yaitu di ekor atas, tetapi bukan di ekor bawah. Bagaimana bisa kamu tidak melihat itu satu arah? Saya akan menyertakan plot lain yang mungkin membantu.

— Glen_b -Reinstate Monica

@ Jeramy Komentar saya merujuk pada tes yang mengandalkan rasio varians (khususnya, saya menyatakan " Di sini, rasio dua estimasi varians sampel akan ..."). Tes yang Anda rujuk untuk mencari perbedaan lokasi dalam residu absolut dari beberapa ukuran lokasi untuk menemukan perbedaan dalam penyebaran; mereka secara alami mengerjakan tes cara untuk perbedaan lokasi kerja. Karena saya mencoba menunjukkan kasus di mana Anda akan melihat bagian bawah F, Brown-Forsythe (& beberapa tes lain yang mencari perbedaan lokasi dalam beberapa ukuran penyimpangan untuk menyimpulkan perbedaan penyebaran) tidak akan membantu

— Glen_b -Reinstate Monica

@ Jeramy Saya telah menambahkan beberapa kata untuk membuatnya lebih eksplisit. Anda mungkin ingin mencatat bahwa meskipun Brown-Forsythe, Levene, dan sebagainya menggunakan F-tables, distribusi statistik uji tidak benar-benar didistribusikan F, bahkan berdasarkan asumsi pengujian.

— Glen_b -Reinstate Monica

Harus dipahami bahwa tujuan ANOVA adalah untuk memeriksa apakah ada ketimpangan sarana ... yang menyiratkan bahwa kita prihatin dengan variasi besar antara sampel (& dengan demikian berarti variasi dihitung dari sarana) dibandingkan dengan variasi dalam sampel (Sekali lagi dihitung dari mean sampel individu). Ketika variasi antara sampel kecil (menghasilkan nilai F berada di sisi kiri) tidak masalah karena perbedaan ini tidak signifikan. Variasi antara sampel penting jika secara signifikan lebih tinggi dari dalam variasi & dalam hal demikian nilai F akan lebih besar dari 1, & oleh karena itu di ekor kanan.

Satu-satunya pertanyaan yang tersisa adalah mengapa menempatkan seluruh tingkat signifikansi di ekor kanan & jawabannya lagi serupa. Penolakan terjadi hanya ketika rasio F di sisi kanan & tidak pernah ketika rasio F di sisi kiri. Tingkat signifikansi adalah ukuran kesalahan karena keterbatasan statistik. Karena penolakan hanya terjadi di sebelah kanan, maka seluruh tingkat signifikansi (risiko kesalahan misklusi) disimpan di sebelah kanan. `

— Prof Pradeep Pai
sumber

Nilai yang diharapkan untuk Mean Square (MS) dalam perawatan adalah varians populasi, sedangkan nilai yang diharapkan untuk MS antara perawatan adalah varians populasi PLUS varian perawatan. Dengan demikian, rasio F = MS antara / MSwithin selalu lebih besar dari 1, dan tidak pernah kurang dari 1.

Karena ketelitian tes 1-tailed lebih baik daripada tes 2-tailed, kami lebih suka menggunakan tes 1-tailed.

— Jeff Cotter
sumber

Saya tidak percaya klaim dalam kalimat terakhir paragraf pertama Anda benar ... E (pembilang)> E (penyebut) tidak menyiratkan pembilang itu> penyebut.

— Glen_b -Reinstate Monica

Selain dari poin Glen_b, saya tidak yakin tentang "karena ketepatan tes 1-tailed lebih baik daripada tes 2-tailed, kami lebih suka menggunakan tes 1-tailed." Bisakah Anda menjelaskan apa yang Anda maksudkan dengan ini? Berbicara tentang ketepatan sepertinya bagi saya untuk melewatkan intinya.

— Silverfish

Presisi sama dengan setengah interval kepercayaan. Untuk F-stat yang sama, tes 1-ekor akan menolak hipotesis nol dengan nilai-p yang lebih kecil (setengah, sebenarnya). Sebaliknya, tes 1-ekor dapat menolak hipotesis nol dengan nilai F-stat yang lebih kecil. Ini menyiratkan bahwa tes 1 ekor dapat mendeteksi efek pengobatan dengan sampel yang lebih sedikit atau dengan varians penyebab yang lebih umum hadir dalam sampel. Ini membuat tes 1 ekor lebih diinginkan, jika seseorang mencari efek.

— Jeff Cotter 6-15

Ya, statistik F yang dihitung bisa kurang dari 1,0. Namun, kesimpulannya akan gagal untuk menolak hipotesis nol "tidak ada efek pengobatan". Karena itu, tidak ada wilayah kritis di ekor bawah. Oleh karena itu, uji-F adalah uji satu sisi atas. Di ANOVA, argumen logis didasarkan pada nilai yang diharapkan untuk MS_treat dan MS_error. Di bawah hipotesis "tanpa efek pengobatan", H0: E (MS_treat) = E (MS_error) = varians populasi. Setiap efek pengobatan yang signifikan menghasilkan HA: E (MS_treat)> E (MS_error). (Sumber teks Montgomery yang mencakup ANOVA). Dengan demikian, HA menyiratkan tes satu sisi.

— Jeff Cotter 6-15