Saya telah menemukan rumor bahwa beberapa studi menunjukkan bahwa kinerja model prediksi lebih tergantung pada keahlian analis data dengan metode yang dipilih daripada pada pilihan metode.
Dengan kata lain, klaimnya adalah bahwa lebih penting bahwa analis data memahami metode yang dipilih daripada seberapa "tepat" metode tersebut untuk masalah dari sudut pandang yang lebih teoretis.
Ini disebutkan dalam konteks chemometrics, yang biasanya melibatkan masalah banyak variate (100s - 1000s), multiple collinearity, dan tentu saja, terlalu sedikit sampel. Prediksi mungkin adalah klasifikasi atau regresi.
Pengalaman pribadi saya menunjukkan bahwa ini masuk akal , tetapi sebuah penelitian disebutkan (saya bertanya kepada orang yang menyebutkan itu melalui email setelah pencarian cepat tetapi tidak berhasil, tetapi tidak pernah menerima jawaban apa pun). Namun, juga dengan pencarian yang lebih rumit, saya tidak dapat melacak kertas apa pun.
Adakah yang tahu tentang temuan itu? Jika tidak, apa pengalaman pribadi dari Big Guys di sini?