Saya memiliki masalah regresi linier. Singkatnya, saya punya dataset, saya membaginya menjadi dua himpunan bagian. Satu subset digunakan untuk menemukan regresi linier (subset pelatihan), yang lain digunakan untuk mengevaluasinya (subset evaluasi). Pertanyaan saya adalah bagaimana cara mengevaluasi hasil regresi linier ini setelah menerapkannya pada subset evaluasi data?
Berikut detailnya:
Di bagian pelatihan, saya melakukan regresi linier: dimana adalah groundtruth (juga dikenal sebagai target), adalah variabel independen. Lalu saya menemukan dan . ( dan diberikan dalam subset pelatihan).
Sekarang, gunakan dan ditemukan di atas dari bagian pelatihan, menerapkannya ke bagian evaluasi, saya menemukan . Dengan kata lain, ini ditemukan dari regresi linier dengan . Sekarang, sebagai tambahan, Saya juga punya dari set evaluasi. Bagaimana cara mengevaluasi hasil saya (berapa banyak berbeda dari )? Adakah model matematika umum untuk melakukan itu? Perlu semacam model / rumus matematika. Saya bisa memikirkan cara yang berbeda untuk melakukannya, tetapi mereka semua agak ad-hoc atau sederhana, tetapi ini adalah untuk karya ilmiah, sehingga hal-hal yang terdengar ad-hoc tidak dapat digunakan di sini, sayangnya.
Ada ide?