Pertanyaannya adalah asumsi yang salah. Banyak orang melakukan apa yang Anda katakan "tidak bisa" lakukan.
Faktanya, implementasi pencarian grid dalam paket sklearn yang digunakan secara luas tidak hanya itu. Kecuali refit=False, itu akan melatih model akhir menggunakan seluruh data.
Saya pikir untuk beberapa hiperparameter ini mungkin tidak terlalu diinginkan, karena mereka relatif terhadap volume data. Misalnya, pertimbangkan min_samples_leaftaktik pra-pemangkasan untuk pohon keputusan . Jika Anda memiliki lebih banyak data, pra-pemangkasan mungkin tidak berfungsi seperti yang Anda inginkan.
Tetapi sekali lagi, kebanyakan orang benar-benar berlatih menggunakan seluruh data setelah cross-validation, sehingga mereka berakhir dengan model terbaik.
Tambahan: @NeilSlater mengatakan di bawah ini bahwa beberapa orang melakukan penahanan di atas CV. Dengan kata lain, mereka memiliki tes kereta split dan kemudian melakukan pemilihan model pada pelatihan. Menurutnya, mereka melatih ulang menggunakan set pelatihan asli, tetapi tidak set pengujian. Set pengujian kemudian digunakan untuk melakukan estimasi model akhir. Secara pribadi, saya melihat tiga kelemahan dalam hal ini: (a) tidak menyelesaikan masalah yang saya sebutkan dengan beberapa hiperparameter tergantung pada volume pelatihan karena Anda tetap berlatih kembali, (b) ketika menguji banyak model, saya lebih suka lebih canggih metode seperti validasi silang bersarang sehingga tidak ada data yang terbuang, dan (c) tahan adalah metode yang mengerikan untuk menyimpulkan bagaimana model akan digeneralisasi ketika Anda memiliki sedikit data.