jika diamati matriks data dan adalah variabel laten maka
Di mana adalah rata-rata dari data yang diamati, dan adalah kesalahan Gaussian / noise dalam data, dan disebut subruang utama.
Pertanyaan saya adalah ketika PCA biasa digunakan kita akan mendapatkan satu set ortonormal vektor eigen yang berikut benar
Tetapi dalam PPCA, bukan vektor ortonormal atau eigen. Jadi bagaimana saya bisa mendapatkan komponen utama dari ?
Mengikuti insting saya, saya mencari ppca di MATLAB, tempat saya menemukan baris ini:
Pada konvergensi, kolom W merentang subruang, tetapi tidak ortonormal. ppca memperoleh koefisien ortonormal, koefisien, untuk komponen dengan ortogonisasi W.
Saya memodifikasi kode ppca sedikit untuk mendapatkan W , berlari dan setelah orthogonalization aku mendapatkan P dari W .
Mengapa orthogonalization ini memberikan vektor eigen, di mana sebagian besar varian akan terlihat?
Saya berasumsi, ortogonalisasi memberi saya satu set vektor ortogonal / ortonormal yang membentang subruang utama, tetapi mengapa matriks hasil ortogonalisasi ini sama dengan eigenmatrix (saya tahu bahwa eigenmatrix di pca juga ortonormal)? Dapatkah saya menganggap subruang utama hanya direntang oleh satu set vektor ortonormal yang unik? Dalam hal ini, kedua hasil akan selalu bertepatan.