Menafsirkan skor PCA


16

Adakah yang bisa membantu saya menafsirkan skor PCA? Data saya berasal dari kuesioner tentang sikap terhadap beruang. Menurut muatan, saya telah menafsirkan salah satu komponen utama saya sebagai "takut beruang". Apakah skor komponen utama tersebut terkait dengan bagaimana masing-masing responden mengukur hingga komponen utama tersebut (apakah ia mendapat skor positif / negatif di komponen itu)?


Jawaban singkat untuk pertanyaan Anda adalah YA.
Amuba kata Reinstate Monica

Jawaban:


13

Pada dasarnya, skor faktor dihitung sebagai respons mentah yang dibobot oleh pemuatan faktor. Jadi, Anda perlu melihat loading faktor dari dimensi pertama Anda untuk melihat bagaimana masing-masing variabel berhubungan dengan komponen utama. Mengamati pemuatan positif (resp. Negatif) tinggi yang terkait dengan variabel spesifik berarti bahwa variabel ini berkontribusi positif (resp. Negatif) terhadap komponen ini; karenanya, orang yang mendapat skor tinggi pada variabel-variabel ini akan cenderung memiliki skor faktor yang lebih tinggi (resp. lebih rendah) pada dimensi khusus ini.

Menggambar lingkaran korelasi berguna untuk memiliki gambaran umum tentang variabel-variabel yang berkontribusi "positif" vs "negatif" (jika ada) ke sumbu utama pertama, tetapi jika Anda menggunakan R, Anda dapat melihat pada paket FactoMineR dan yang dimdesc()fungsi.

Berikut ini adalah contoh dengan USArrestsdatanya:

> data(USArrests)
> library(FactoMineR)
> res <- PCA(USArrests)
> dimdesc(res, axes=1)  # show correlation of variables with 1st axis
$Dim.1
$Dim.1$quanti
         correlation  p.value
Assault        0.918 5.76e-21
Rape           0.856 2.40e-15
Murder         0.844 1.39e-14
UrbanPop       0.438 1.46e-03
> res$var$coord  # show loadings associated to each axis
         Dim.1  Dim.2  Dim.3   Dim.4
Murder   0.844 -0.416  0.204  0.2704
Assault  0.918 -0.187  0.160 -0.3096
UrbanPop 0.438  0.868  0.226  0.0558
Rape     0.856  0.166 -0.488  0.0371

Seperti dapat dilihat dari hasil terbaru, dimensi pertama terutama mencerminkan tindakan kekerasan (dalam bentuk apa pun). Jika kita melihat pada peta individual, jelas bahwa negara-negara yang terletak di sebelah kanan adalah yang paling sering melakukan tindakan seperti itu.

teks alternatif teks alternatif

Anda mungkin juga tertarik dengan pertanyaan terkait ini: Apa skor komponen utama?


5

Bagi saya, skor PCA hanyalah pengaturan ulang data dalam bentuk yang memungkinkan saya untuk menjelaskan kumpulan data dengan lebih sedikit variabel. Skor mewakili seberapa banyak setiap item terkait dengan komponen. Anda bisa menamainya sebagai analisis faktor, tetapi penting untuk diingat bahwa mereka bukan variabel laten, karena PCA menganalisis semua varians dalam kumpulan data, bukan hanya elemen yang sama (seperti analisis faktor).


Ya, Anda benar mengatakan bahwa tidak ada model kesalahan yang tergabung dalam PCA, yang bertentangan dengan FA. Saya telah memberi +1 untuk titik tertentu itu. Perhatikan bahwa saya mengatakan "masuk akal untuk mempertimbangkan", bukan komponen utama yang diekstrak dari PCA adalah LVs yang sebenarnya. Kecuali jika Anda tertarik untuk menilai keandalan skala atau model pengukuran, tidak ada bedanya apakah Anda menggunakan PCA atau FA. Sekarang, analisis data sering berkaitan dengan menjelaskan korelasi antara variabel atau menemukan kelompok subjek, maka gagasan menafsirkan satu atau lebih dimensi ruang faktorial. (...)
chl

(...) FactoMineR mencakup kumpulan data tentang anggur, dan banyak metode faktor dapat digunakan untuk bermain dengannya (PCA, MFA), dan bahkan PLS atau CCA seperti yang telah dilakukan oleh Michel Tenenhaus.
chl

@ chl, Terima kasih atas petunjuk tentang paketnya, saya akan memeriksanya. Pada PCA vs FA saya setuju sampai titik tertentu. Saya lebih suka FA untuk sebagian besar aplikasi, karena saya mendanai perkiraan komunitas (varian umum) sangat berguna dalam menilai nilai struktur faktor tertentu. Itu mungkin hanya preferensi pribadi.
richiemorrisroe

Anda sepenuhnya benar (saya sudah meningkatkan tanggapan Anda sebelumnya karena dibuat sangat jelas). Hanya saja (tidak diputar) PCA memiliki sejarahnya sendiri dalam analisis data (khususnya sekolah Prancis), bersama dengan CA, MFA, MCA. Di sisi lain, Paul Kline memiliki dua buku yang sangat bagus tentang penggunaan FA dalam penelitian Kepribadian. Dan buku William Revelle yang akan datang pasti cocok untuk pengguna R :) Yah, bagaimanapun juga, saya pikir kami setuju bahwa ini adalah alat yang berguna untuk menganalisis struktur matriks korelasi.
chl

0

Hasil PCA (dimensi atau komisaris berbeda) umumnya tidak dapat diterjemahkan ke dalam konsep nyata. Saya pikir salah untuk mengasumsikan bahwa salah satu komponen adalah "takut beruang" apa yang membuat Anda berpikir bahwa itu yang dimaksud dengan komponen? Prosedur komponen utama mengubah matriks data Anda menjadi matriks data baru dengan jumlah dimensi yang sama atau kurang, dan dimensi yang dihasilkan berkisar dari yang lebih menjelaskan varians ke yang menjelaskan lebih sedikit. Komponen ini dihitung berdasarkan kombinasi variabel asli dengan vektor eigen yang dihitung. Prosedur PCA keseluruhan mengubah variabel asli menjadi variabel ortogonal (bebas linear). Semoga ini bisa membantu Anda menjelaskan sedikit tentang prosedur pca


Apakah Anda setuju bahwa kombinasi linear dari beberapa variabel masih dapat ditafsirkan sebagai mencerminkan semacam kontribusi tertimbang dari masing-masing variabel ke sumbu faktor?
chl

Ya, persis seperti itu.
mariana soffer

Jadi, mengapa mencegah memberi nama? Variabel hanya dianggap sebagai variabel manifes, dan dalam beberapa kasus masuk akal untuk mempertimbangkan kombinasi tertimbang mereka sebagai faktor laten (tidak teramati).
chl
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.