Resensi harus memberitahu Anda mengapa Spearman tidak tepat. Ini adalah salah satu versinya: Biarkan datanya mana adalah variabel terukur dan adalah indikator gender, katakan itu 0 (pria), 1 (wanita). Kemudian Spearman dihitung berdasarkan jajaran masing-masing. Karena hanya ada dua nilai yang mungkin untuk indikator , akan ada banyak ikatan, sehingga rumus ini tidak sesuai. Jika Anda mengganti peringkat dengan peringkat rata-rata, maka Anda hanya akan mendapatkan dua nilai yang berbeda, satu untuk pria, satu lagi untuk wanita. Laluρ(Zi,Ii)ZIρZ,IIρpada dasarnya akan menjadi versi yang disusun kembali dari peringkat rata-rata antara kedua kelompok. Akan lebih sederhana (lebih dapat diartikan) untuk hanya membandingkan cara! Pendekatan lain adalah sebagai berikut.
Misalkan menjadi pengamatan variabel kontinu di antara pria, sama di antara wanita. Sekarang, jika distribusi dan adalah sama, maka akan menjadi 0,5 (mari kita asumsikan distribusinya benar-benar kontinu, sehingga tidak ada ikatan). Dalam kasus umum, tentukan
mana adalah undian acak di antara pria, antara wanita. Bisakah kita memperkirakan dari sampel kita? Bentuk semua pasangan (anggap tidak ada ikatan) dan hitung berapa banyak yang kita miliki "pria lebih besar" ( ) (X1,…,XnY1,…,YmXYP(X>Y)
θ=P(X>Y)
XYθ(Xi,Yj)Xi>YjM) dan berapa banyak "wanita lebih besar" ( ) ( ). Maka satu perkiraan sampel adalah
Itu adalah salah satu ukuran korelasi yang masuk akal! (Jika hanya ada beberapa ikatan, abaikan saja). Tetapi saya tidak yakin apa itu namanya, jika memiliki nama. Ini mungkin sudah dekat:
https://en.wikipedia.org/wiki/Goodman_and_Kruskal%27s_gammaXi<YjWθMM+W