Latar belakang: Saya bertanya kepada ratusan peserta dalam survei saya berapa banyak mereka tertarik pada bidang-bidang tertentu (dengan lima poin skala Likert dengan 1 menunjukkan "tidak tertarik" dan 5 menunjukkan "tertarik").
Lalu saya mencoba PCA. Gambar di bawah ini adalah proyeksi ke dalam dua komponen utama pertama. Warna digunakan untuk jenis kelamin dan panah PCA adalah variabel asli (yaitu minat).
Aku tahu itu:
- Titik (responden) dipisahkan cukup baik oleh komponen kedua.
- Tidak ada panah yang tersisa.
- Beberapa panah jauh lebih pendek daripada yang lain.
- Variabel cenderung membuat kelompok, tetapi bukan pengamatan.
- Tampaknya panah yang mengarah ke bawah (ke laki-laki) utamanya adalah minat laki-laki dan panah yang mengarah ke atas adalah kepentingan perempuan.
- Beberapa panah tidak menunjuk ke bawah atau ke atas.
Pertanyaan: Bagaimana mengartikan hubungan antara titik (responden), warna (jenis kelamin) dan panah (variabel) dengan benar? Apa kesimpulan lain tentang responden dan minat mereka yang dapat ditambang dari plot ini?
Data dapat ditemukan di sini .