Mungkin pertanyaan ini naif, tetapi:
Jika regresi linier terkait erat dengan koefisien korelasi Pearson, adakah teknik regresi yang terkait erat dengan koefisien korelasi Kendall dan Spearman?
Mungkin pertanyaan ini naif, tetapi:
Jika regresi linier terkait erat dengan koefisien korelasi Pearson, adakah teknik regresi yang terkait erat dengan koefisien korelasi Kendall dan Spearman?
Jawaban:
Ada cara yang sangat mudah untuk menggunakan hampir semua ukuran korelasi agar sesuai dengan regresi linier, dan yang mereproduksi kuadrat terkecil ketika Anda menggunakan korelasi Pearson.
Definisi ini berfungsi, misalnya, dengan segala macam korelasi berdasarkan peringkat dan kuat. Ini juga dapat digunakan untuk mendapatkan interval untuk lereng (dengan cara biasa - dengan menemukan lereng yang menandai batas antara hanya korelasi yang signifikan dan hanya korelasi yang tidak signifikan).
Berikut korelasi yang diplot terhadap kemiringan car
data di R:
Korelasi Pearson memotong 0 pada kemiringan kuadrat terkecil, 3,932
Korelasi Kendall memotong 0 pada kemiringan Theil-Sen, 3,667
Korelasi Spearman melintasi 0 memberikan kemiringan "garis Spearman" di 3,714
Itu adalah tiga perkiraan kemiringan untuk contoh kita. Sekarang kita perlu penyadapan. Untuk kesederhanaan, saya hanya akan menggunakan residu rata-rata untuk intersep pertama dan median untuk dua lainnya (tidak terlalu penting dalam kasus ini):
intercept
Pearson: -17.573 *
Kendall: -15.667
Spearman: -16.285
* (perbedaan kecil dari kuadrat terkecil adalah karena kesalahan pembulatan dalam estimasi kemiringan; tidak diragukan lagi ada kesalahan pembulatan yang serupa dalam perkiraan lainnya)
Garis-garis yang sesuai (menggunakan skema warna yang sama seperti di atas) adalah:
Sunting: Dengan perbandingan, kemiringan kuadran-korelasi adalah 3,333
Baik korelasi Kendall dan korelasi Spearman secara substansial lebih kuat untuk pencilan yang berpengaruh daripada kuadrat terkecil. Lihat di sini untuk contoh dramatis dalam kasus Kendall.
Model PO adalah kasus khusus dari keluarga yang lebih umum dari model probabilitas kumulatif (beberapa panggilan tautan kumulatif) termasuk model probit, bahaya proporsional, dan log-log pelengkap. Untuk studi kasus, lihat Bab 15 dari Handout saya .
Aaron Han (1987 dalam ekonometrik) mengusulkan penduga Korelasi Peringkat Maksimum yang cocok dengan model regresi dengan memaksimalkan tau. Dougherty dan Thomas (2012 dalam literatur psikologi) baru-baru ini mengusulkan algoritma yang sangat mirip. Ada banyak pekerjaan di MRC yang menggambarkan sifat-sifatnya.
Aaron K. Han, Analisis non-parametrik dari model regresi umum: Penaksir korelasi peringkat maksimum, Jurnal Ekonometrika, Volume 35, Masalah 2-3, Juli 1987, Halaman 303-316, ISSN 0304-4076, http: // dx.doi.org/10.1016/0304-4076(87)90030-3 . ( http://www.sciencedirect.com/science/article/pii/0304407687900303 )
Dougherty, MR, & Thomas, RP (2012). Pengambilan keputusan yang kuat di dunia nonlinier. Ulasan psikologis, 119 (2), 321. Diperoleh dari http://damlab.umd.edu/pdf%20articles/DoughertyThomas2012Rev.pdf .