P( M.saya< Fj) > 12saya , jM.sayasaya
Tentu saja interpretasi lain dari frase itu mungkin (itulah ambiguitas, dan semua kemungkinan lainnya mungkin konsisten dengan alasan Anda).
[Kami juga memiliki masalah apakah kita berbicara tentang sampel atau populasi ... "kebanyakan pria [...] kebanyakan wanita" tampaknya merupakan pernyataan populasi (tentang populasi waktu potensial) tetapi kami hanya mengamati waktu bahwa kita tampaknya memperlakukan sebagai sampel, jadi kita harus berhati-hati dengan seberapa luas kita membuat klaim.]
P( M.saya< Fj) >12M.˜<F˜
[Saya tidak mengatakan Anda salah dalam berpikir bahwa proporsi pasangan MF acak di mana pria lebih cepat daripada wanita lebih dari 1/2 - Anda hampir pasti benar. Saya hanya mengatakan Anda tidak bisa mengatakannya dengan membandingkan median. Anda juga tidak dapat mengatakannya dengan melihat proporsi pada setiap sampel di atas atau di bawah median sampel lainnya. Anda harus membuat perbandingan yang berbeda.]
12
Contoh:
Kumpulan data A:
1.58 2.10 16.64 17.34 18.74 19.90 1.53 2.78 16.48 17.53 18.57 19.05
1.64 2.01 16.79 17.10 18.14 19.70 1.25 2.73 16.19 17.76 18.82 19.08
1.42 2.56 16.73 17.01 18.86 19.98
Kumpulan data B:
3.35 4.62 5.03 20.97 21.25 22.92 3.12 4.83 5.29 20.82 21.64 22.06
3.39 4.67 5.34 20.52 21.10 22.29 3.38 4.96 5.70 20.45 21.67 22.89
3.44 4.13 6.00 20.85 21.82 22.05
Perangkat data C:
6.63 7.92 8.15 9.97 23.34 24.70 6.40 7.54 8.24 9.37 23.33 24.26
6.18 7.74 8.63 9.62 23.07 24.80 6.54 7.37 8.37 9.09 23.22 24.16
6.57 7.58 8.81 9.08 23.43 24.45
(Data ada di sini , tetapi digunakan untuk tujuan yang berbeda di sana - untuk ingatan saya, saya membuat ini sendiri)
Perhatikan bahwa proporsi A <B adalah 2/3, proporsi A <C adalah 5/9 dan proporsi B <C adalah 2/3. A vs B dan B vs C keduanya signifikan pada level 5% tetapi kita dapat mencapai tingkat signifikansi apa pun hanya dengan menambahkan salinan sampel yang cukup. Kita bahkan dapat menghindari ikatan, dengan menduplikasi sampel tetapi menambahkan jitter yang cukup kecil (cukup kecil dari celah terkecil di antara titik-titik)
Median sampel menuju ke arah lain: median (A)> median (B)> median (C)
Sekali lagi kita dapat mencapai signifikansi untuk beberapa perbandingan median - dengan tingkat signifikansi apa pun - dengan mengulangi sampel.
Untuk mengaitkannya dengan masalah saat ini, bayangkan A adalah "waktu wanita" dan B adalah "waktu pria". Maka waktu rata-rata pria lebih cepat, tetapi pria yang dipilih secara acak akan 2/3 waktunya lebih lambat daripada wanita yang dipilih secara acak.
Dengan mengambil isyarat kami dari sampel A dan C kami dapat menghasilkan set data yang lebih besar (dalam R) sebagai berikut:
n <- 300
F <- c(runif(n/3,0,5),runif(n-n/3,15,20))
M <- c(runif(n-n/3,7.5,12.5),runif(n/3,22.5,27.5))
Median F akan menjadi sekitar 16,25 sedangkan median M akan menjadi sekitar 11,25 tetapi proporsi kasus di mana F <M akan menjadi 5/9.
n13
P( F< med ( M) ) = 23P(M.> med ( F) ) = 23med ( M) < med ( F)