FA, PCA, dan ICA, semuanya 'terkait', di mana ketiganya mencari vektor basis yang diproyeksikan terhadap data, sehingga Anda memaksimalkan masukkan-kriteria-sini. Pikirkan vektor basis hanya sebagai enkapsulasi kombinasi linear.
Z2NNw=[0.1−4]y
y=wTZ
y1N
Jadi apa kriteria itu?
Kriteria Orde Kedua:
Di PCA, Anda menemukan vektor basis yang 'paling menjelaskan' varian data Anda. Vektor dasar pertama (yaitu peringkat tertinggi) akan menjadi yang paling sesuai dengan semua varian dari data Anda. Yang kedua juga memiliki kriteria ini, tetapi harus ortogonal dengan yang pertama, dan seterusnya dan seterusnya. (Ternyata vektor basis tersebut untuk PCA tidak lain adalah vektor eigen dari matriks kovarian data Anda).
Dalam FA, ada perbedaan antara itu dan PCA, karena FA adalah generatif, sedangkan PCA tidak. Saya telah melihat FA digambarkan sebagai 'PCA dengan noise', di mana 'noise' disebut 'faktor spesifik'. Semua sama, kesimpulan keseluruhan adalah bahwa PCA dan FA didasarkan pada statistik orde kedua, (kovarians), dan tidak ada yang di atas.
Kriteria Pesanan Tinggi:
Di ICA, Anda kembali menemukan vektor basis, tetapi kali ini, Anda ingin vektor basis yang memberikan hasil, sehingga vektor yang dihasilkan ini adalah salah satu komponen independen dari data asli. Anda dapat melakukan ini dengan memaksimalkan nilai absolut kurtosis yang dinormalisasi - statistik urutan ke-4. Artinya, Anda memproyeksikan data Anda pada beberapa vektor dasar, dan mengukur kurtosis hasilnya. Anda mengubah sedikit vektor basis Anda (biasanya melalui pendakian gradien), dan kemudian mengukur kurtosis lagi, dll. Akhirnya Anda akan terjadi pada vektor basis yang memberi Anda hasil yang memiliki kurtosis tertinggi, dan ini adalah kemandirian Anda. komponen.
Diagram atas di atas dapat membantu Anda memvisualisasikannya. Anda dapat melihat dengan jelas bagaimana vektor ICA sesuai dengan sumbu data, (tidak tergantung satu sama lain), sedangkan vektor PCA mencoba menemukan arah di mana varians dimaksimalkan. (Agak seperti resultan).
Jika pada diagram atas, vektor PCA terlihat seperti mereka hampir bersesuaian dengan vektor ICA, itu hanya kebetulan. Berikut ini adalah contoh lain pada data yang berbeda dan pencampuran matriks di mana mereka sangat berbeda. ;-)