Saya mencoba mendapatkan intuisi mengapa peningkatan jumlah fitur dapat mengurangi kinerja. Saat ini saya menggunakan classifier LDA yang berkinerja lebih baik secara bivariat di antara fitur-fitur tertentu tetapi lebih buruk ketika melihat lebih banyak fitur. Akurasi klasifikasi saya dilakukan dengan menggunakan xval bertingkat 10 kali lipat.
Apakah ada kasus sederhana ketika sebuah classifier akan bekerja lebih baik secara univariat daripada bivaraiately untuk mendapatkan intuisi agak fisik atau spasial dari apa yang terjadi di dimensi yang lebih tinggi ini?