Analisis daya untuk uji Kruskal-Wallis atau Mann-Whitney U menggunakan R?


Jawaban:


3

Tentu saja mungkin untuk menghitung daya.

Untuk lebih spesifik - jika Anda membuat asumsi yang cukup untuk mendapatkan situasi di mana Anda dapat menghitung (dalam beberapa cara) probabilitas penolakan, Anda dapat menghitung daya.

Di Wilcoxon-Mann-Whitney, jika (misalnya) Anda mengasumsikan bentuk distribusi (membuat asumsi tentang bentuk distribusi) dan membuat beberapa asumsi tentang skala (spread) dan nilai spesifik lokasi atau perbedaan lokasi. , Anda mungkin dapat menghitung daya baik secara aljabar atau melalui integrasi numerik; gagal bahwa Anda dapat mensimulasikan tingkat penolakan.

Jadi misalnya jika kita mengasumsikan pengambilan sampel dari distribusi dengan perbedaan lokasi yang ditentukan (distandarisasi untuk skala umum), maka dengan memberikan ukuran sampel, kita dapat mensimulasikan banyak kumpulan data yang memenuhi semua kondisi tersebut dan memperoleh estimasi tingkat penolakan. Jadi mari kita asumsikan kita memiliki dua sampel distribusi (keluarga skala lokasi) dengan skala satuan ( ) - tanpa kehilangan generalitas - dan dengan perbedaan lokasi . Sekali lagi, tanpa kehilangan umum kita dapat mengambil . Kemudian untuk beberapa ukuran sampel yang ditentukan - (katakanlah) - kita dapat mensimulasikan pengamatan dan karenanya kekuatan untuk nilait 5 σ = 1 δ = μ 2 - μ 1 = 1 μ 1 = 0 n 1 = 6 , n 2 = 9 δ / σ 1t5t5σ=1δ=μ2μ1=1μ1=0n1=6,n2=9δ/σ(yaitu ). Berikut ini contoh cepat dalam R:1

n1=6;n2=9;tdf=5;delta=1;al=0.05;nsim=10000
res = replicate(nsim,{y1=rt(n1,tdf);y2=rt(n2,tdf)+delta;wilcox.test(y1,y2)$p.value<=al})
mean(res)  # res will be logical ("TRUE" = reject); mean is rej rate

Tiga simulasi seperti itu menghasilkan tingkat penolakan 0,321, 0,321 dan 0,316; kekuatan tampaknya di sekitar 0,32 (Anda dapat menghitung interval kepercayaan hanya dari satu simulasi itu, karena jumlah penolakan adalah binomial ). Dalam praktiknya saya cenderung menggunakan simulasi yang lebih besar, tetapi jika Anda mensimulasikan banyak atau berbeda, Anda mungkin tidak ingin lebih dari 10.000 simulasi untuk masing-masing simulasi.δnδ

Dengan melakukannya untuk banyak nilai pergeseran lokasi, Anda bahkan bisa mendapatkan kurva daya untuk rangkaian keadaan tersebut karena perubahan lokasi berubah jika Anda mau.

Dalam sampel besar, menggandakan dan akan seperti membagi dua (dan dengan demikian meningkatkan pada diberikan ) sehingga Anda dapat sering mendapatkan perkiraan yang baik di berbagai dari simulasi hanya dengan beberapa nilai . Demikian pula, untuk satu pengujian berekor, jika adalah tingkat penolakan di maka cenderung dekat dengan linear di (sekali lagi, memungkinkan perkiraan yang baik pada berbagai nilai dari simulasi hanya pada beberapa nilain1n2σ2δ/σδnn1biδ=δiΦ1(1b)δδδ(selusin nilai yang dipilih dengan baik seringkali banyak). Pilihan pemulusan yang masuk akal sering kali akan menghasilkan perkiraan kekuatan yang sangat baik pada nilai atau .nδ

Anda tidak perlu membatasi diri Anda hanya pada pergeseran lokasi. Setiap perubahan dalam parameter yang cenderung mengarah pada perubahan akan menjadi sesuatu yang dapat Anda selidiki.P(Y2>Y1)

Perhatikan bahwa walaupun tes ini bebas distribusi (untuk distribusi kontinu) di bawah nol, perilaku berbeda di bawah asumsi distribusi berbeda untuk alternatif.

Situasi untuk Kruskal-Wallis serupa, tetapi Anda memiliki lebih banyak pergeseran lokasi (atau situasi apa pun yang Anda lihat) untuk ditentukan.

Plot dalam jawaban ini menunjukkan perbandingan kurva daya untuk uji t berpasangan dengan daya simulasi untuk tes peringkat bertanda pada ukuran sampel tertentu, melintasi berbagai pergeseran lokasi standar untuk pengambilan sampel dari distribusi normal dengan korelasi tertentu antara pasangan. Perhitungan serupa dapat dilakukan untuk Mann-Whitney dan Kruskal-Wallis.

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.