Saya memiliki classifier yang saya lakukan validasi silang, bersama dengan seratus atau lebih fitur yang saya lakukan seleksi maju untuk menemukan kombinasi fitur yang optimal. Saya juga membandingkan ini dengan menjalankan eksperimen yang sama dengan PCA, di mana saya mengambil fitur potensial, menerapkan SVD, mengubah sinyal asli ke ruang koordinat baru, dan menggunakan fitur atas dalam proses seleksi maju saya.
Intuisi saya adalah bahwa PCA akan meningkatkan hasil, karena sinyal akan lebih "informatif" daripada fitur aslinya. Apakah pemahaman naif saya tentang PCA membawa saya ke masalah? Adakah yang bisa menyarankan beberapa alasan umum mengapa PCA dapat meningkatkan hasil dalam beberapa situasi, tetapi memperburuknya dalam situasi lain?