Baru-baru ini saya menemukan makalah yang mengusulkan menggunakan pengklasifikasi k-NN pada dataset tertentu. Para penulis menggunakan semua sampel data yang tersedia untuk melakukan validasi silang k-fold untuk nilai k yang berbeda dan melaporkan hasil validasi silang dari konfigurasi hyperparameter terbaik.
Sepengetahuan saya, hasil ini bias, dan mereka seharusnya mempertahankan set tes terpisah untuk mendapatkan perkiraan akurasi pada sampel yang tidak digunakan untuk melakukan optimasi hyperparameter.
Apakah saya benar? Dapatkah Anda memberikan beberapa referensi (sebaiknya makalah penelitian) yang menggambarkan penyalahgunaan validasi silang ini?