Data penangkapan AS yang digabungkan dengan R hanyalah sebuah contoh di sini, tetapi saya perhatikan bahwa perhitungan pemuatan dalam pertanyaan tersebut berasal dari PCA dari matriks kovarians . Itu di suatu tempat antara sewenang-wenang dan tidak masuk akal, karena variabel diukur pada skala yang berbeda.
Populasi perkotaan terlihat seperti persen. California 91% dan tertinggi.
Tiga variabel kejahatan tampaknya adalah jumlah penangkapan untuk kejahatan yang diekspresikan relatif terhadap ukuran populasi (mungkin untuk beberapa periode waktu). Mungkin itu didokumentasikan di suatu tempat entah itu penangkapan per 1000 atau 10.000 atau apa pun.
Rata-rata dari variabel serangan di unit yang diberikan adalah sekitar 171 dan pembunuhan rata-rata sekitar 8. Jadi, penjelasan beban Anda adalah bahwa sebagian besar polanya adalah artefak: itu tergantung pada variabilitas variabel yang sangat berbeda.
Jadi, meskipun ada data yang masuk akal bahwa ada lebih banyak penangkapan karena serangan daripada pembunuhan, dll., Fakta yang diketahui (atau tidak mengejutkan) mendominasi analisis.
Ini menunjukkan bahwa, sebagaimana di mana pun dalam statistik, Anda harus memikirkan apa yang Anda lakukan dalam PCA.
Jika Anda mengambil ini lebih lanjut:
Saya berpendapat bahwa persen perkotaan lebih baik ditinggalkan dari analisis. Menjadi urban bukanlah kejahatan; tentu saja dapat melayani proxy untuk variabel yang mempengaruhi kejahatan.
PCA berdasarkan matriks korelasi akan lebih masuk akal dalam pandangan saya. Kemungkinan lain adalah bekerja dengan logaritma tingkat penangkapan, bukan tingkat penangkapan (semua nilai positif; lihat di bawah).
Catatan: Jawaban @ random_guy sengaja menggunakan matriks kovarians.
Berikut adalah beberapa statistik ringkasan. Saya menggunakan Stata, tapi itu tidak penting.
Variable | Obs Mean Std. Dev. Min Max
-------------+--------------------------------------------------------
urban_pop | 50 65.54 14.47476 32 91
murder | 50 7.788 4.35551 .8 17.4
rape | 50 21.232 9.366384 7.3 46
assault | 50 170.76 83.33766 45 337