Efisiensi relatif peringkat yang ditandatangani Wilcoxon dalam sampel kecil

Saya telah melihat dalam literatur yang diterbitkan (dan diposting di sini) bahwa efisiensi relatif asimptotik dari uji peringkat Wilcoxon menandatangani setidaknya 0,864 bila dibandingkan dengan uji t. Saya juga pernah mendengar bahwa ini hanya berlaku untuk sampel besar, meskipun beberapa buku tidak menyebutkan ini (ada apa dengan itu?).

Lagi pula, pertanyaan saya adalah, seberapa kecil hal-hal yang perlu didapatkan sebelum paragraf di atas tidak berlaku lagi?

Dalam kasus saya, saya memiliki 4 pasang data. Jika semua asumsi berlaku, saya tahu saya memiliki kekuatan setidaknya 90% untuk mendeteksi ukuran efek 2SD di bawah uji t berpasangan jika saya menggunakan alpha 0,1 dan memiliki data berkorelasi sedang. Namun, saya ingin menggunakan uji peringkat bertanda Wilcoxon karena ukuran sampel yang kecil dan ketidakmampuan untuk memeriksa asumsi tapi saya khawatir tes akan memiliki kekuatan yang terlalu kecil jika saya melakukannya. Terima kasih!

— Jimj
sumber

"Asimptotik" apa pun dalam "sampel kecil" tidak masuk akal: ini kontradiksi. Saya menduga Anda meminta efisiensi relatif yang sebenarnya dalam sampel kecil, titik. Jawabannya tergantung pada distribusi dasar yang Anda bandingkan dan akan menjadi rumit kecuali Anda memiliki dua distribusi khusus. Banyak orang memilih Normal untuk referensi, tetapi itu mungkin tidak tepat untuk aplikasi Anda.

— whuber

Ya saya mencari efisiensi relatif dalam sampel kecil. Terima kasih telah menunjukkannya. Saya ingin tahu apa yang terburuk yang bisa saya lakukan dengan bijaksana. Saya tidak benar-benar memiliki distribusi yang mendasari dalam pikiran tetapi jika saya menggunakan normal, seperti yang Anda sarankan, bagaimana saya akan melanjutkan? Saya tahu bahwa itu juga akan tergantung pada seberapa berkorelasi data.

— Jimj

Apa itu "data berkorelasi sedang"?

— Glen_b -Reinstate Monica

Perhatikan bahwa daya di atas 90% Anda akan berada pada normal, bukan pada distribusi di mana ARE adalah 0,864. Dengan demikian perhitungan harus dilakukan pada normal

— Glen_b -Reinstate Monica

@ Glen_b: Anda benar, saya harus menentukan apa yang saya pikirkan dengan korelasi sedang. Saya memikirkan korelasi setidaknya 0,4. Jadi bagaimana cara saya melakukan perhitungan? JUGA, dalam hal pertanyaan awal saya tentang membandingkan efisiensi dari dua tes pada ukuran sampel kecil, saya melakukan sedikit riset tentang topik ini. Beberapa sumber menunjukkan bahwa jawabannya tidak sepenuhnya jelas dalam sampel yang lebih kecil tetapi tes Wilcoxon berkinerja cukup baik. Mungkin aku hanya harus hidup dengan jawaban seperti itu untuk saat ini.

— Jimj

Klotz melihat kekuatan sampel kecil dari tes peringkat yang ditandatangani dibandingkan dengan satu sampel dalam kasus normal. $t$

[Klotz, J. (1963) "Sampel Kecil Kekuatan dan Efisiensi untuk Satu Sampel Tes Wilcoxon dan Skor Normal" The Annals of Mathematical Statistics , Vol. 34, No. 2, hlm. 624-632]

Pada dan dekat (tepat s tentu saja tidak dapat dicapai, kecuali jika Anda menggunakan rute pengacakan, yang kebanyakan orang hindari dalam penggunaan, dan saya pikir dengan alasan) efisiensi relatif untuk pada pada normal cenderung cukup dekat dengan ARE di sana (0,955), meskipun seberapa dekat tergantung (bervariasi dengan perubahan rata-rata dan pada lebih kecil , efisiensinya akan lebih rendah). Pada ukuran sampel yang lebih kecil dari 10 efisiensi umumnya (sedikit) lebih tinggi. $n=10$ $\alpha$ $0.1$ $\alpha$ $t$ $\alpha$

Pada dan (keduanya dengan mendekati 0,05), efisiensinya sekitar 0,97 atau lebih tinggi. $n=5$ $n=6$ $\alpha$

Jadi, secara umum ... ARE pada normal adalah perkiraan yang terlalu rendah dari efisiensi relatif dalam kasus sampel kecil, selama tidak kecil. Saya percaya bahwa untuk tes dua sisi dengan Anda terkecil yang dapat dicapai adalah 0,125. Pada tingkat signifikansi yang tepat dan ukuran sampel, saya pikir efisiensi relatif terhadap akan sama tinggi (mungkin masih di sekitar 0,97-0,98 atau lebih tinggi) di daerah di mana kekuatannya menarik. $\alpha$ $n=4$ $\alpha$ $t$

Saya mungkin harus kembali dan berbicara tentang cara melakukan simulasi, yang relatif mudah.

Edit:

Saya baru saja melakukan simulasi pada level 0,125 (karena dapat dicapai pada ukuran sampel ini); kelihatannya - di berbagai perbedaan rata-rata, efisiensi tipikal sedikit lebih rendah, untuk , lebih banyak di sekitar 0,95-0,97 atau lebih - mirip dengan nilai asimptotik. $n=4$

Memperbarui

Berikut adalah plot kekuatan (2 sisi) untuk uji-t (dihitung oleh power.t.test) dalam sampel normal, dan kekuatan simulasi untuk uji peringkat bertanda Wilcoxon - 40000 simulasi per poin, dengan uji-t sebagai varian kontrol. Ketidakpastian dalam posisi titik-titik kurang dari satu piksel:

kurva daya untuk t dan daya untuk Wilcoxon

Untuk membuat jawaban ini lebih lengkap saya harus benar-benar melihat perilaku untuk kasus yang sebenarnya adalah 0,864 (beta (2,2)).

— Glen_b -Reinstate Monica
sumber