Mann-Whitney null hipotesis di bawah varians tidak sama

Saya hanya ingin tahu tentang hipotesis nol dari tes Mann-Whitney U. Saya sering melihatnya menyatakan bahwa hipotesis nol adalah bahwa dua populasi memiliki distribusi yang sama. Tapi saya berpikir - jika saya memiliki dua populasi normal dengan rata-rata yang sama tetapi sangat tidak sama, tes Mann-Whitney mungkin tidak akan mendeteksi perbedaan ini.

Saya juga telah melihatnya menyatakan bahwa hipotesis nol dari uji Mann-Whitney adalah $\Pr(X>Y)=0.5$ atau probabilitas pengamatan dari satu populasi ( $X$ ) melebihi pengamatan dari populasi kedua ( $Y$ ) (setelah pengecualian ikatan) sama dengan 0,5 . Ini tampaknya lebih masuk akal tetapi tampaknya tidak setara dengan hipotesis nol pertama yang saya nyatakan.

Saya berharap untuk mendapatkan sedikit bantuan untuk mengurai ini. Terima kasih!

hypothesis-testing variance wilcoxon-mann-whitney

— Jimj
sumber

Jawaban:

Uji Mann-Whitney adalah kasus khusus dari tes permutasi (distribusi di bawah nol diturunkan dengan melihat semua permutasi yang mungkin dari data) dan tes permutasi memiliki nol sebagai distribusi yang identik, sehingga secara teknis benar.

Salah satu cara berpikir dari statistik uji Mann-Whitney adalah ukuran berapa kali nilai yang dipilih secara acak dari satu kelompok melebihi nilai yang dipilih secara acak dari kelompok lain. Jadi P (X> Y) = 0,5 juga masuk akal dan ini secara teknis adalah properti dari distribusi yang sama dengan nol (dengan asumsi distribusi kontinu di mana probabilitas suatu ikatan adalah 0). Jika 2 distribusi adalah sama maka probabilitas X lebih besar dari Y adalah 0,5 karena keduanya diambil dari distribusi yang sama.

Kasus 2 distribusi yang menyatakan memiliki mean yang sama tetapi varians yang sangat berbeda cocok dengan hipotesis nol kedua, tetapi bukan yang pertama dari distribusi yang identik. Kita dapat melakukan beberapa simulasi untuk melihat apa yang terjadi dengan nilai-p dalam kasus ini (secara teori mereka harus didistribusikan secara seragam):

> out <- replicate( 100000, wilcox.test( rnorm(25, 0, 2), rnorm(25,0,10) )$p.value )
> hist(out)
> mean(out < 0.05)
[1] 0.07991
> prop.test( sum(out<0.05), length(out), p=0.05 )

        1-sample proportions test with continuity correction

data:  sum(out < 0.05) out of length(out), null probability 0.05
X-squared = 1882.756, df = 1, p-value < 2.2e-16
alternative hypothesis: true p is not equal to 0.05
95 percent confidence interval:
 0.07824054 0.08161183
sample estimates:
      p 
0.07991

Jadi jelas ini menolak lebih sering dari yang seharusnya dan hipotesis nol salah (ini cocok dengan persamaan distribusi, tetapi tidak prob = 0,5).

Berpikir dalam hal probabilitas X> Y juga mengalami beberapa masalah menarik jika Anda pernah membandingkan populasi yang didasarkan pada Efron's Dice .

— Greg Snow
sumber

Hai Greg, terima kasih atas jawabannya. Kedengarannya seperti apa yang Anda katakan adalah saya menemukan sedikit kasus khusus di mana tes tidak berfungsi dengan baik di bawah nol distribusi yang sama. Dan lebih jauh lagi, hipotesis nol yang saya nyatakan tidak sama. Apakah itu benar?

— Jimj

Mann-Whitney tidak sensitif terhadap perubahan varians dengan rata-rata yang sama, tetapi dapat - seperti yang Anda lihat dengan bentuk , mendeteksi perbedaan yang menyebabkan menyimpang dari (misalnya di mana kedua mean dan varians meningkat bersama). Cukup jelas jika Anda memiliki dua normals dengan mean yang sama, perbedaannya simetris tentang nol. Karenanya , yang merupakan situasi nol. $P(X>Y)=0.5$ $P(X>Y)$ $0.5$ $P(X>Y) = P(X-Y>0) = \frac{1}{2}$

Misalnya, jika Anda memiliki distribusi menjadi eksponensial dengan rata-rata sedangkan memiliki distribusi eksponensial dengan rata-rata (perubahan skala), Mann-Whitney peka terhadap itu (memang, mengambil log dari kedua sisi, itu hanya sebuah pergeseran lokasi, dan Mann-Whitney tidak terpengaruh oleh transformasi monoton). $Y$ $1$ $X$ $k$

Jika Anda tertarik pada tes yang secara konseptual sangat mirip dengan Mann-Whitney yang sensitif terhadap perbedaan dalam penyebaran di bawah kesetaraan median, ada beberapa tes seperti itu.

Ada tes Siegel-Tukey dan tes Ansari-Bradley, misalnya, keduanya terkait erat dengan uji dua sampel Mann-Whitney-Wilcoxon.

Keduanya didasarkan pada ide dasar peringkat dari ujung.

Jika Anda menggunakan R, tes Ansari-Bradley dibangun di ... ?ansari.test

Siegel-Tukey berlaku hanya melakukan tes Mann-Whitney-Wilcoxon pada peringkat dihitung dari sampel berbeda; jika Anda membuat peringkat data sendiri, Anda tidak benar-benar membutuhkan fungsi terpisah untuk nilai-p. Namun demikian, Anda dapat menemukan beberapa, seperti di sini:

http://www.r-statistics.com/2010/02/siegel-tukey-a-non-parametric-test-for-equality-in-variability-r-code/

(terkait dengan komentar ttnphns di bawah jawaban asli saya)

Anda akan terlalu menafsirkan respons saya untuk membacanya sebagai tidak setuju dengan @GregSnow dalam arti yang sangat substantif. Tentu saja ada perbedaan dalam penekanan dan sampai batas tertentu dalam apa yang kita bicarakan, tetapi saya akan sangat terkejut jika ada banyak perbedaan pendapat di baliknya.

Mari kita kutip Mann dan Whitney: " statistik yang tergantung pada peringkat relatif dari dan diusulkan untuk menguji hipotesis . " Itu tegas; itu sepenuhnya mendukung posisi @ GregSnow. $U$ $x$ $y$ $f=g$

Sekarang, mari kita lihat bagaimana statistik dibangun: " Biarkan menghitung berapa kali mendahului sebuah . $U$ $y$ $x$ " Sekarang jika nol mereka benar, probabilitas dari peristiwa itu adalah ... tapi ada cara lain untuk mendapatkan probabilitas 0,5, dan dalam arti itu orang mungkin menafsirkan bahwa tes dapat bekerja dalam keadaan lain. Sejauh mereka memperkirakan probabilitas (skala ulang) > , itu mendukung apa yang saya katakan. $\frac{1}{2}$ $Y$ $X$

Namun, agar tingkat signifikansi dijamin benar, Anda membutuhkan distribusi agar sesuai dengan distribusi nol. Itu didasarkan pada asumsi bahwa semua permutasi dari label label kelompok dan untuk pengamatan gabungan di bawah nol sama-sama mungkin. Ini tentu saja kasus di bawah . Persis seperti yang dikatakan @GregSnow. $U$ $X$ $Y$ $f=g$

Pertanyaannya adalah sejauh mana hal ini terjadi (yaitu bahwa distribusi statistik uji cocok dengan yang diperoleh dengan asumsi bahwa , atau kira-kira demikian), untuk null yang lebih umum dinyatakan. $f=g$

Saya percaya bahwa dalam banyak situasi memang demikian; khususnya untuk situasi termasuk tetapi lebih umum daripada yang Anda gambarkan (dua populasi normal dengan rata-rata yang sama tetapi varians yang sangat tidak sama dapat digeneralisasi sedikit tanpa mengubah distribusi yang dihasilkan berdasarkan peringkat), saya percaya bahwa distribusi statistik uji ternyata memiliki distribusi yang sama di mana ia diturunkan dan karenanya harus valid di sana. Saya melakukan beberapa simulasi yang sepertinya mendukung ini. Namun, itu tidak akan selalu menjadi tes yang sangat berguna (mungkin memiliki daya yang buruk).

Saya tidak memberikan bukti bahwa inilah masalahnya. Saya telah menerapkan beberapa argumen intuisi / tangan-bergelombang dan juga melakukan beberapa simulasi dasar yang menunjukkan itu benar - bahwa Mann-Whitney bekerja (karena memiliki distribusi 'benar' di bawah nol) jauh lebih luas daripada ketika . $f=g$

Buat apa yang Anda mau, tapi saya tidak menafsirkan ini sebagai perselisihan substantif dengan @GregSnow

Referensi - makalah asli Mann & Whitney

— Glen_b -Reinstate Monica
sumber

Apakah saya mendapatkan benar bahwa Anda setuju dengan kata-kata ini dari halaman pembicaraan Mann-Whitney Wikipedia:

the null hypothesis of Mann-Whitney U-test is not about the equality of distributions. Is is about the symmetry between two populations with respect to the probability of obtaining a larger observation

. Jadi Anda tidak setuju dengan jawaban @ Greg, kan?

— ttnphns

Saya telah menambahkan beberapa diskusi di edit.

— Glen_b -Reinstate Monica

Tambahan yang sangat bagus. Saya akan mempelajarinya (saya selalu merasa seolah-olah ada nuansa dalam tes MW yang terus menghindari saya). Sementara itu, apakah Anda setuju jika saya akan mengatakan: "Karena statistik uji MW mencerminkan hanya (dalam) kesetaraan peringkat rata - rata , mungkin ada situasi ketika f ~ = g [Saya mengerti f, g sebagai distribusi asli, peringkat sebelumnya] tetapi tes ini nevetherless sepenuhnya relevan karena terus berurusan dengan H0 yang sama seperti di bawah f = g. Contoh dari situasi tersebut adalah distribusi simetris yang sepenuhnya identik kecuali untuk parameter spread (varians) ".

— ttnphns

Dalam notasi (Mann dan Whitney by the way), dan adalah kepadatan dari dan . Saya setuju bahwa sejauh saya telah memverifikasi / memahami keadaan, pernyataan Anda tampaknya menjadi masalahnya. Aku curiga masih banyak tentang Mann-Whitney yang juga menghindariku.

f

$f$

g

$g$

X

$X$

Y

$Y$

— Glen_b -Reinstate Monica