Tes permutasi: kriteria untuk memilih statistik uji


9

Saya secara teratur menggunakan tes permutasi dan menyukai kesederhanaannya. Saya telah belajar paling banyak dari buku "Metode Resampling" oleh Good, di mana penulis tampaknya cukup kreatif dalam pilihan statistik uji di seluruh contoh. Juga posting ini memberi kesan bahwa ada kebebasan besar untuk memilih statistik uji.

Saya bertanya-tanya apakah ada persyaratan teoritis yang harus dipenuhi oleh statistik uji . Atau bisakah kita menggunakan statistik apa saja asalkan secara intuitif masuk akal dan memiliki tingkat kesalahan Tipe I / II yang bagus?

Sebagai contoh, ketika tes permutasi digunakan sebagai pengganti uji-t karena populasi yang tidak normal, saya telah melihat beberapa kali bahwa nilai p tes permutasi masih diperoleh dari t-statistik. Meskipun tidak selalu salah, sepertinya ini adalah pilihan aneh mengingat asal mula distribusi Siswa.

Jawaban:


8

Statistik-t masuk akal sebagai statistik uji; banyak orang menganggapnya intuitif. Jika saya mengutip t-statistik 0,5 atau 5,5, ia memberi tahu Anda sesuatu - berapa banyak kesalahan standar selain dari rata-rata.

Kesulitan - setidaknya dengan ketidaknormalan sedang - tidak begitu banyak dengan menggunakan statistik sebagai menggunakan t-distribusi untuk distribusinya di bawah nol. Statistiknya cukup masuk akal.

Tentu saja, jika Anda mengharapkan ekor yang jauh lebih berat daripada yang normal, statistik yang lebih kuat akan lebih baik, tetapi statistik t tidak terlalu sensitif terhadap penyimpangan ringan dari normalitas (misalnya itu kurang senstif daripada statistik varians-rasio).

Jika Anda hanya ingin menggunakan pembilang statistik, itu hebat, itu masuk akal sebagai statistik permutasi, jika Anda tertarik pada perbedaan dalam mean. Jika Anda tertarik dengan pergeseran lokasi yang lebih umum, ini akan membuka banyak kemungkinan lain.

Anda benar untuk berpikir bahwa ada banyak kebebasan untuk memilih statistik dan menyesuaikannya dengan keadaan tertentu - alternatif apa yang Anda ingin lawan lawan, atau kemungkinan masalah apa yang ingin Anda perkuat (kontaminasi, misalnya, dapat dampak daya).

Sebenarnya hampir tidak ada batasan - Anda bebas memilih hampir apa saja, termasuk statistik uji yang tidak berguna. Ada beberapa pertimbangan yang harus Anda pikirkan ketika memilih tes, tentu saja, tetapi Anda bebas untuk tidak melakukannya.

-

Konon, ada beberapa kriteria yang bisa diterapkan dalam berbagai keadaan.

Misalnya, jika Anda secara khusus tertarik pada jenis hipotesis tertentu, Anda dapat menggunakan statistik yang mencerminkannya - misalnya, jika Anda ingin menguji perbedaan dalam populasi, sering kali masuk akal untuk membuat statistik uji Anda terkait dengan perbedaan dalam sampel berarti.

Jika Anda mengetahui sesuatu tentang jenis distribusi yang mungkin Anda miliki - ekor yang berat, atau condong, atau ekor yang tidak jelas tetapi dengan beberapa tingkat kontaminasi, atau bimodal, ... Anda dapat menyusun statistik uji yang mungkin berhasil dalam keadaan seperti itu, misalnya, memilih statistik yang harus berkinerja baik dalam situasi yang diantisipasi tetapi memiliki ketahanan terhadap kontaminasi.

-

Simulasi adalah salah satu cara untuk menyelidiki kekuatan dalam berbagai situasi.

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.