PCA adalah salah satu dari banyak cara untuk menganalisis struktur matriks korelasi yang diberikan. Dengan konstruksi, sumbu utama pertama adalah yang memaksimalkan varians (tercermin oleh nilai eigennya) ketika data diproyeksikan ke garis (yang merupakan arah dalam ruang dimensi, dengan asumsi Anda memiliki variabel ) dan yang kedua adalah ortogonal untuk itu, dan masih memaksimalkan varian yang tersisa. Ini adalah alasan mengapa menggunakan dua sumbu pertama harus menghasilkan perkiraan yang lebih baik dari ruang variabel asli (katakanlah, matriks dari dim ) ketika diproyeksikan ke pesawat.halhalXn × p
Komponen utama hanyalah kombinasi linear dari variabel asli. Oleh karena itu, merencanakan skor faktor individu (didefinisikan sebagai , di mana adalah vektor pemuatan komponen utama mana pun) dapat membantu menyoroti kelompok individu yang homogen, misalnya, atau untuk menafsirkan skor keseluruhan seseorang ketika mempertimbangkan semua variabel pada saat yang sama. Dengan kata lain, ini adalah cara untuk meringkas lokasi seseorang sehubungan dengan nilainya padaXkamukamuhalvariabel, atau kombinasi keduanya. Dalam kasus Anda, Gbr. 13.3 di HSAUR menunjukkan bahwa Joyner-Kersee (Jy-K) memiliki skor tinggi (negatif) pada sumbu 1, menunjukkan bahwa ia berkinerja secara keseluruhan cukup baik pada semua acara. Garis penalaran yang sama berlaku untuk menafsirkan sumbu kedua. Saya melihat sosok itu dengan sangat singkat sehingga saya tidak akan menjelaskan secara terperinci dan interpretasi saya tentu saja dangkal. Saya berasumsi bahwa Anda akan menemukan informasi lebih lanjut di buku teks HSAUR. Di sini perlu dicatat bahwa variabel dan individu ditampilkan pada diagram yang sama (ini disebut biplotr ( x1, x2) = cos2( x1, x2)
Saya pikir, bagaimanapun, Anda sebaiknya mulai membaca beberapa buku pengantar tentang analisis multivariat untuk mendapatkan wawasan mendalam tentang metode berbasis PCA. Sebagai contoh, BS Everitt menulis buku teks yang bagus tentang topik ini, An R dan S-Plus ® Companion to Multivariate Analysis , dan Anda dapat memeriksa situs web pengiring untuk ilustrasi. Ada paket R hebat lainnya untuk analisis data multivarian terapan, seperti ade4 dan FactoMineR .