Apa yang dipahami oleh varians dalam beberapa dimensi ("total variance") hanyalah sejumlah varian di setiap dimensi. Secara matematis, ini adalah jejak dari matriks kovarians: jejak hanyalah jumlah dari semua elemen diagonal. Definisi ini memiliki berbagai sifat yang bagus, misalnya jejak tidak berubah di bawah transformasi linear ortogonal, yang berarti bahwa jika Anda memutar sumbu koordinat Anda, varian total tetap sama.
Apa yang dibuktikan dalam buku Bishop (bagian 12.1.1), adalah bahwa vektor eigen terkemuka dari matriks kovarians memberikan arah varian maksimal. Vektor eigen kedua memberikan arah varians maksimal di bawah batasan tambahan bahwa itu harus ortogonal ke vektor eigen pertama, dll. (Saya percaya ini merupakan Latihan 12.1). Jika tujuannya adalah untuk memaksimalkan varians total dalam subruang 2D, maka prosedur ini adalah maksimalisasi serakah: pertama pilih satu sumbu yang memaksimalkan varians, lalu yang lain.
Pertanyaan Anda adalah: mengapa prosedur serakah ini mencapai maksimum global?
Berikut adalah argumen yang bagus yang @whuber sarankan dalam komentar. Mari kita selaraskan sistem koordinat dengan sumbu PCA. Matriks kovarians menjadi diagonal: . Untuk kesederhanaan kami akan mempertimbangkan kasus 2D yang sama, yaitu apa bidang dengan varians total maksimal? Kami ingin membuktikan bahwa itu adalah bidang yang diberikan oleh dua vektor basis pertama (dengan varian total ).Σ=diag(λi)λ1+λ2
Pertimbangkan pesawat yang direntang oleh dua vektor ortogonal dan . Varians total dalam pesawat ini adalahJadi ini adalah kombinasi linear dari nilai eigen dengan koefisien yang semuanya positif, tidak melebihi (lihat di bawah), dan jumlah ke . Jika demikian, maka hampir jelas bahwa maksimum tercapai di .uv
u⊤Σu+v⊤Σv=∑λiu2i+∑λiv2i=∑λi(u2i+v2i).
λi12λ1+λ2
Hanya dibiarkan menunjukkan bahwa koefisien tidak boleh melebihi . Perhatikan bahwa , di mana adalah vektor basis -th. Kuantitas ini adalah panjang kuadrat dari proyeksi pada bidang yang direntang oleh dan . Oleh karena itu harus lebih kecil dari panjang kuadrat dari yang sama dengan , QED.1u2k+v2k=(u⋅k)2+(v⋅k)2kkkuvk|k|2=1
Lihat juga jawaban @ cardinal untuk Apa fungsi objektif PCA? (Ini mengikuti logika yang sama).