Saya ingin mengurangi dimensi sistem orde tinggi dan menangkap sebagian besar kovarian pada bidang 2 dimensi atau 1 dimensi yang lebih disukai. Saya mengerti ini bisa dilakukan melalui analisis komponen utama, dan saya telah menggunakan PCA dalam banyak skenario. Namun, saya belum pernah menggunakannya dengan tipe data boolean, dan saya bertanya-tanya apakah itu berarti melakukan PCA dengan set ini. Jadi misalnya, berpura-pura saya memiliki metrik kualitatif atau deskriptif, dan saya menetapkan "1" jika metrik itu valid untuk dimensi itu, dan "0" jika tidak (data biner). Jadi misalnya, berpura-puralah Anda mencoba membandingkan Tujuh Kurcaci di Putri Salju. Kita punya:
Doc, Dopey, Bashful, Grumpy, Sneezy, Sleepy and Happy, dan Anda ingin mengaturnya berdasarkan kualitas, dan melakukannya seperti:
Jadi misalnya Bashful tidak toleran laktosa dan bukan pada daftar kehormatan. Ini murni matriks hipotetis, dan matriks saya yang sebenarnya akan memiliki lebih banyak kolom deskriptif. Pertanyaan saya adalah, apakah masih pantas untuk melakukan PCA pada matriks ini sebagai sarana untuk menemukan kesamaan antara individu?
a means of finding the similarity between individuals
. Tetapi tugas ini adalah untuk analisis Cluster, bukan PCA.