Selain jawaban yang sudah fokus pada properti matematika, saya ingin mengomentari dari sudut pandang eksperimental.
Ringkasan: proses pembuatan data sering dioptimalkan dengan cara yang membuat data cocok untuk komponen utama (PCR) atau regresi kuadrat terkecil parsial (PLS).
Saya ahli kimia analitik. Ketika saya merancang eksperimen / metode untuk mengukur (regresi atau klasifikasi) sesuatu, saya menggunakan pengetahuan saya tentang aplikasi dan instrumen yang tersedia untuk mendapatkan data yang membawa rasio sinyal terhadap noise yang baik sehubungan dengan tugas yang dihadapi. Itu berarti, data yang saya hasilkan dirancang untuk memiliki kovarians besar dengan properti yang menarik.
Ini mengarah ke struktur varians di mana varians menarik besar, dan PC kemudian akan membawa noise (kecil) saja.
Saya juga lebih suka metode yang menghasilkan informasi yang berlebihan tentang tugas yang dihadapi, agar mendapatkan hasil yang lebih kuat atau lebih tepat. PCA mengkonsentrasikan saluran pengukuran yang berlebihan ke dalam satu PC, yang kemudian membawa banyak variasi dan karenanya merupakan salah satu PC pertama.
Jika ada perancu diketahui yang akan menyebabkan varians besar yang tidak berkorelasi dengan properti yang diminati, saya biasanya akan mencoba untuk memperbaikinya sebanyak mungkin selama preprocessing data: dalam banyak kasus perancu ini diketahui sifat fisik atau kimia, dan pengetahuan ini menyarankan cara yang tepat untuk memperbaiki perancu. Misalnya saya mengukur spektrum Raman di bawah mikroskop. Intensitas mereka tergantung pada intensitas sinar laser serta seberapa baik saya bisa memfokuskan mikroskop. Keduanya mengarah pada perubahan yang dapat dikoreksi dengan menormalkan misalnya ke sinyal yang dikenal konstan.
Dengan demikian, kontributor besar varians yang tidak berkontribusi pada solusi mungkin telah dihilangkan sebelum data memasuki PCA, meninggalkan sebagian besar varians yang bermakna di PC pertama.
Last but not least, ada sedikit ramalan yang terpenuhi dengan sendirinya di sini: Jelas PCR dilakukan dengan data di mana asumsi bahwa varians pembawa informasi besar memang masuk akal. Jika misalnya saya berpikir bahwa mungkin ada perancu penting yang saya tidak tahu cara memperbaikinya, saya akan segera mencari PLS yang lebih baik mengabaikan kontribusi besar yang tidak membantu tugas prediksi.