Dalam kasus PCA, "varians" berarti variatif sumatif atau variabilitas multivariat atau variabilitas keseluruhan atau variabilitas total . Di bawah ini adalah matriks kovarians dari 3 variabel. Variansnya ada pada diagonal, dan jumlah dari 3 nilai (3.448) adalah keseluruhan variabilitas.
1.343730519 -.160152268 .186470243
-.160152268 .619205620 -.126684273
.186470243 -.126684273 1.485549631
Sekarang, PCA menggantikan variabel asli dengan variabel baru, yang disebut komponen utama, yang bersifat ortogonal (yaitu mereka memiliki nol kovariat) dan memiliki varian (disebut nilai eigen) dalam urutan menurun. Jadi, matriks kovarians antara komponen utama yang diekstraksi dari data di atas adalah ini:
1.651354285 .000000000 .000000000
.000000000 1.220288343 .000000000
.000000000 .000000000 .576843142
Perhatikan bahwa jumlah diagonal masih 3,448, yang mengatakan bahwa ketiga komponen tersebut bertanggung jawab atas semua variabilitas multivariat. Komponen utama 1 menyumbang atau "menjelaskan" 1,651 / 3,448 = 47,9% dari keseluruhan variabilitas; yang ke-2 menjelaskan 1.220 / 3.448 = 35,4% dari itu; yang ke-3 menjelaskan .577 / 3.448 = 16.7% dari itu.
Jadi, apa yang mereka maksudkan ketika mereka mengatakan bahwa " PCA memaksimalkan varians " atau " PCA menjelaskan varian maksimal "? Tentu saja, itu tidak menemukan perbedaan terbesar di antara tiga nilai 1.343730519 .619205620 1.485549631
, tidak. PCA menemukan, dalam ruang data, dimensi (arah) dengan varian terbesar dari keseluruhan varian 1.343730519+.619205620+1.485549631 = 3.448
. Varians terbesar itu adalah 1.651354285
. Kemudian ia menemukan dimensi varian terbesar kedua, ortogonal ke varian pertama, dari 3.448-1.651354285
varian keseluruhan yang tersisa . Dimensi kedua itu adalah 1.220288343
varian. Dan seterusnya. Dimensi terakhir yang tersisa adalah .576843142
varians. Lihat juga "Pt3" di sini dan jawabannya di sini menjelaskan bagaimana hal itu dilakukan secara lebih rinci.
Secara matematis, PCA dilakukan melalui fungsi aljabar linier yang disebut dekomposisi eigen atau dekomposisi svd. Fungsi-fungsi ini akan mengembalikan Anda semua nilai eigen 1.651354285 1.220288343 .576843142
(dan vektor eigen yang sesuai) sekaligus ( lihat , lihat ).