Saya memiliki model regresi sederhana ( y = param1 * x1 + param2 * x2 ). Ketika saya memasukkan model ke data saya, saya menemukan dua solusi yang baik:
Solusi A, params = (2,7), yang terbaik pada set pelatihan dengan RMSE = 2.5
TAPI! Solusi B params = (24,20) menang besar pada set validasi , ketika saya melakukan validasi silang.
solusi A dikelilingi oleh solusi buruk. Jadi ketika saya menggunakan solusi A, modelnya lebih sensitif terhadap variasi data.
solusi B dikelilingi oleh solusi OK, sehingga kurang sensitif terhadap perubahan data.
Apakah ini teori baru yang saya ciptakan, bahwa solusi dengan tetangga yang baik tidak terlalu berlebihan? :))
Apakah ada metode optimasi umum yang akan membantu saya mendukung solusi B, untuk solusi A?
TOLONG!