Adakah yang bisa membantu memberikan penjelasan konseptual tentang bagaimana prediksi dibuat untuk data baru saat menggunakan smooths / splines untuk model prediksi? Misalnya, mengingat model yang dibuat menggunakan gamboost
dalam mboost
paket di R, dengan p-splines, bagaimana prediksi untuk data baru dibuat? Apa yang digunakan dari data pelatihan?
Katakanlah ada nilai baru dari variabel independen x dan kami ingin memprediksi y. Apakah rumus untuk pembuatan spline diterapkan pada nilai data baru ini menggunakan knot atau df yang digunakan ketika melatih model dan kemudian koefisien dari model yang terlatih diterapkan untuk menghasilkan prediksi?
Berikut ini adalah contoh dengan R, apa yang diprediksi dilakukan secara konseptual ke output 899,4139 untuk data baru mean_radius = 15,99?
#take the data wpbc as example
library(mboost)
data(wpbc)
modNew<-gamboost(mean_area~mean_radius, data = wpbc, baselearner = "bbs", dfbase = 4, family=Gaussian(),control = boost_control(mstop = 5))
test<-data.frame(mean_radius=15.99)
predict(modNew,test)