Intuisi di balik korelasi nama 'parsial' dan 'marginal'


12

Adakah yang tahu mengapa korelasi bersyarat antara 2 variabel disebut korelasi "parsial" dan korelasi sederhana di antara mereka (jadi, ketika tidak dikondisikan pada variabel lain) disebut korelasi "marginal"? Apa intuisi di balik kata "parsial" dan "marjinal"? Apa yang mereka lakukan dengan "bagian" atau "margin"?

Akan baik untuk mempelajari jawabannya untuk memahami konsep-konsep itu dengan lebih baik.


Jawaban:


11

Istilah "marginal" sudah sangat tua. Jika Anda kembali cukup jauh dalam sejarah, tidak ada jurnal ilmiah (terbukti mereka mulai sekitar 1665 ). Sebagai gantinya, hasil sementara dikomunikasikan melalui surat tulisan tangan, dan hasil akhir ditulis dalam buku. Ada cenderung tidak banyak cara grafis data sebelum Playfair , tetapi buku mungkin sering memiliki tabel dengan angka di bawah kondisi yang berbeda. Pertimbangkan tabel ini:
xI,AIAIx

ABCDIxI,AxI,BxI,CxI,DIIxII,AxII,BxII,CxII,DIIIxIII,AxIII,BxIII,CxIII,DIVxIV,AxIV,BxIV,CxIV,D
; yaitu, mereka memberikan angka untuk kombinasi kondisi tertentu. Namun, terkadang pembaca ingin tahu seperti apa kondisi tertentu tanpa memperhatikan variabel lainnya. Bayangkan adalah jumlah kali sesuatu terjadi ketika variabel pertama adalah dan variabel kedua adalah . Kemudian, seseorang mungkin ingin tahu, seberapa sering hal ini terjadi ketika variabel pertama adalah tidak peduli apa variabel kedua itu? Sangat mudah untuk mengetahui hal ini, Anda hanya meringkasxI,AIAIxdi baris pertama dan abaikan kolom. Orang-orang biasa melakukan hal semacam ini secara umum, dan mereka (secara alami) menulis angka-angka di pinggir buku di samping meja. Jika angka aslinya bersyarat, tidak ada nama untuk angka-angka lainnya; mereka dikenal sebagai " marginal ".

Apa hubungan angka-angka itu dengan korelasi? Ya, itu bukan koneksi langsung, tetapi begitu Anda memiliki gagasan untuk 'tidak memperhitungkan variabel lain', dan Anda memiliki nama untuk itu ("marginal"), ketika konteks baru muncul yang analog (yaitu, korelasi) , nama dan idenya hanya diterapkan.


Saya tidak tahu etimologi korelasi parsial, tetapi saya bisa memberi Anda intuisi. Ini agak mudah, sungguh: Anda berurusan dengan korelasi antara bagian dari satu variabel dan bagian yang lain. Pertimbangkan gambar ini:

masukkan deskripsi gambar di sini

Kita bisa membayangkan lingkaran kiri adalah variabel , lingkaran yang tepat adalah variabel , dan lingkaran atas adalah variabel . Korelasi antara dua variabel terkait dengan seberapa banyak lingkaran tumpang tindih (pada kenyataannya, kita dapat membayangkan area lingkaran mewakili variabilitas masing-masing variabel dan bahwa persentase area adalah ). Sekarang jelas bahwa ada beberapa korelasi antara dan , tetapi ada juga beberapa korelasi antara dan , dan antara dan . Bagaimana jika Anda ingin tahu apa korelasinya antara bagian-bagianY Z r 2 X Y X Z Y Z X Y ZXYZr2XYXZYZXdan yang tidak terkait denganYZ ? Itu akan menjadi korelasi parsial . Ini terkait dengan tumpang tindih antara dua bagian lingkaran yang tidak termasuk sliver atas yang bersinggungan dengan lingkaran atas.

Saya menyukai halaman web ini karena menyediakan diskusi yang mudah dimengerti tentang korelasi parsial dan topik terkait. Hanya bagian pertama tentang korelasi parsial per se, tetapi saya sangat merekomendasikan membaca seluruh halaman (meskipun agak panjang). Meskipun tidak terkait langsung, pembahasan di utas ini: Di mana perbedaan antara semua IV dalam persamaan regresi linier berganda? , semoga bermanfaat juga.


1
Terima kasih! Menguraikan ini menuntun saya ke pertanyaan lain tentang simetri. Kita tahu itu . Apakah properti yang sama berlaku untuk korelasi parsial, yaitu ? Dengan menggunakan rumus di atas, kita dapat menulis: , dan saya tidak berpikir itu akan selalu sama dengan karena penyebutnya dapat berubah (apakah ukuran lingkaran mewakili dan berdasarkan ukuran himpunan dan ukuran himpunan ? )? ρ(X,Y)=ρ(Y,X)ρXY|Z=ρYX|ZρYX|Z=Area(1)Area(X(2+center))ρXY|ZρYX|ZXYXY
Kiran K.

1
Itu mungkin pertanyaan baru, @KiranK. Ini pertanyaan yang bagus & kami tidak ingin itu terkubur dalam komentar di mana orang tidak akan pernah menemukannya.
gung - Reinstate Monica

Ide bagus, saya mem-posting ulang pertanyaan di sini: stats.stackexchange.com/questions/195410/…
Kiran K.

0

Korelasi antara 2 variabel (yang Anda sebut korelasi marginal) menunjukkan bahwa kedua variabel sampel menunjukkan beberapa ketergantungan.ρXYX,Y

Korelasi parsial mengukur korelasi residual antara begitu pengaruh variabel perancu telah dihilangkan dengan regresi linier.ρXYZX,YZ

Dalam istilah matematika, ini dinyatakan sebagai:

ρXYZ:=ρXYρXZρYZ1ρXZ21ρYZ2

Untuk menggambarkan properti yang berasal dari definisi ini, kita dapat mempertimbangkan dua kasus batas:

  • jika dan keduanya berkorelasi 0% dengan variabel , maka korelasi parsial adalah korelasinya:XYZ

    ρXYZ=ρXY

  • Namun jika berkorelasi 100% dengan , maka korelasi parsial selalu 0 tidak peduli nilai .YZρXY

ρXYZ=0

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.