Algoritma PCA dapat dirumuskan dalam bentuk matriks korelasi (anggap data telah dinormalisasi dan kami hanya mempertimbangkan proyeksi ke PC pertama). Fungsi objektif dapat ditulis sebagai:
Ini bagus, dan kami menggunakan pengganda Lagrangian untuk menyelesaikannya, yaitu menulis ulang sebagai:
yang setara dengan
dan karenanya ( lihat di sini di Mathworld ) tampaknya sama dengan
Tapi ini mengatakan untuk memaksimalkan jarak antara titik dan garis, dan dari apa yang saya baca di sini , ini tidak benar - seharusnya , bukan . Di mana kesalahan saya?
Atau, dapatkah seseorang menunjukkan kepada saya hubungan antara memaksimalkan varians dalam ruang yang diproyeksikan dan meminimalkan jarak antara titik dan garis?