Saya pikir bagian penting untuk dipertimbangkan dalam menjawab pertanyaan Anda adalah
Saya mencoba mengidentifikasi model terbaik untuk memprediksi harga mobil
karena pernyataan ini menyiratkan sesuatu tentang mengapa Anda ingin menggunakan model. Pilihan model dan evaluasi harus didasarkan pada apa yang ingin Anda capai dengan nilai-nilai yang sesuai.
Pertama, mari kita rekap apa dilakukannyaR2 : Ini menghitung ukuran skala berdasarkan fungsi kerugian kuadrat, yang saya yakin Anda sudah menyadari. Untuk melihat ini, menentukan sisa untuk i th-pengamatan Anda y i dan nilai dipasang sesuai y i . Menggunakan notasi nyaman S S R : = Σ N i = 1 e 2 i , S S T : = Σesaya= ysaya- y^sayaysayay^sayaSSR : = ∑Ni = 1e2saya,R2hanya didefinisikan sebagaiR2=1-SSR/SST.SST: = ¢Ni = 1( ysaya- y¯)2R2R2= 1 - SSR / SST
Kedua, mari kita lihat apa yang menggunakan untuk model pilihan / sarana evaluasiR2 . Misalkan kita memilih dari serangkaian prediksi yang dihasilkan menggunakan model M : M ∈ M , di mana M adalah kumpulan model yang dipertimbangkan (dalam contoh Anda, koleksi ini akan berisi jaringan saraf, hutan acak, jaring elastis, ...). Sejak S S T akan tetap konstan di antara semua model, jika meminimalkan R 2 Anda akan memilih persis model yang meminimalkan S S R . Dengan kata lain, Anda akan memilihY¯M.M.: M∈ M.M.SSTR2SSR yang menghasilkan kerugian kesalahan kuadrat minimal!M.∈ M.
R2SSR L.2L.1
R2L.hal1 ⩽ p < 2p = 1L.halL.hal
Singkatnya, pilihan / evaluasi model tidak dapat dipertimbangkan secara independen dari tujuan model.