Istilah "marginal" sudah sangat tua. Jika Anda kembali cukup jauh dalam sejarah, tidak ada jurnal ilmiah (terbukti mereka mulai sekitar 1665 ). Sebagai gantinya, hasil sementara dikomunikasikan melalui surat tulisan tangan, dan hasil akhir ditulis dalam buku. Ada cenderung tidak banyak cara grafis data sebelum Playfair , tetapi buku mungkin sering memiliki tabel dengan angka di bawah kondisi yang berbeda. Pertimbangkan tabel ini:
xI,AIAIx
sayasayasayasayasayasayasayaVSEBUAHxsaya, Axsayasaya, Axsayasayasaya, AxsayaV, ABxsaya, Bxsayasaya, Bxsayasayasaya, BxsayaV, BCxsaya, Cxsayasaya, Cxsayasayasaya, CxsayaV, CDxsaya, Dxsayasaya, Dxsayasayasaya, DxsayaV, D
; yaitu, mereka memberikan angka untuk kombinasi kondisi tertentu. Namun, terkadang pembaca ingin tahu seperti apa kondisi tertentu tanpa memperhatikan variabel lainnya. Bayangkan adalah jumlah kali sesuatu terjadi ketika variabel pertama adalah dan variabel kedua adalah . Kemudian, seseorang mungkin ingin tahu, seberapa sering hal ini terjadi ketika variabel pertama adalah tidak peduli apa variabel kedua itu? Sangat mudah untuk mengetahui hal ini, Anda hanya meringkas
xsaya, AsayaSEBUAHsayaxdi baris pertama dan abaikan kolom. Orang-orang biasa melakukan hal semacam ini secara umum, dan mereka (secara alami) menulis angka-angka di pinggir buku di samping meja. Jika angka aslinya bersyarat, tidak ada nama untuk angka-angka lainnya; mereka dikenal sebagai "
marginal ".
Apa hubungan angka-angka itu dengan korelasi? Ya, itu bukan koneksi langsung, tetapi begitu Anda memiliki gagasan untuk 'tidak memperhitungkan variabel lain', dan Anda memiliki nama untuk itu ("marginal"), ketika konteks baru muncul yang analog (yaitu, korelasi) , nama dan idenya hanya diterapkan.
Saya tidak tahu etimologi korelasi parsial, tetapi saya bisa memberi Anda intuisi. Ini agak mudah, sungguh: Anda berurusan dengan korelasi antara bagian dari satu variabel dan bagian yang lain. Pertimbangkan gambar ini:
Kita bisa membayangkan lingkaran kiri adalah variabel , lingkaran yang tepat adalah variabel , dan lingkaran atas adalah variabel . Korelasi antara dua variabel terkait dengan seberapa banyak lingkaran tumpang tindih (pada kenyataannya, kita dapat membayangkan area lingkaran mewakili variabilitas masing-masing variabel dan bahwa persentase area adalah ). Sekarang jelas bahwa ada beberapa korelasi antara dan , tetapi ada juga beberapa korelasi antara dan , dan antara dan . Bagaimana jika Anda ingin tahu apa korelasinya antara bagian-bagianY Z r 2 X Y X Z Y Z X Y ZXYZr2XYXZYZXdan yang tidak terkait denganYZ ? Itu akan menjadi korelasi parsial . Ini terkait dengan tumpang tindih antara dua bagian lingkaran yang tidak termasuk sliver atas yang bersinggungan dengan lingkaran atas.
Saya menyukai halaman web ini karena menyediakan diskusi yang mudah dimengerti tentang korelasi parsial dan topik terkait. Hanya bagian pertama tentang korelasi parsial per se, tetapi saya sangat merekomendasikan membaca seluruh halaman (meskipun agak panjang). Meskipun tidak terkait langsung, pembahasan di utas ini: Di mana perbedaan antara semua IV dalam persamaan regresi linier berganda? , semoga bermanfaat juga.