Saat memilih jumlah simpul yang tepat untuk GAM, orang mungkin ingin mempertimbangkan jumlah data dan peningkatan pada sumbu x.
Bagaimana jika kita memiliki 100 peningkatan pada sumbu x dengan 1000 titik data pada setiap kenaikan.
Info di sini mengatakan:
Jika tidak disediakan maka simpul spline ditempatkan secara merata di seluruh nilai kovariat yang merujuk istilah: Misalnya, jika memasang data 101 dengan spline 11 simpul x maka akan ada simpul pada setiap tanggal 10 (dipesan) nilai x.
Jadi awal dasar harus 9 knot dalam contoh ini? Saya hanya tidak yakin kisaran knot apa yang cocok untuk kumpulan data ini karena sangat cocok untuk jumlah yang sangat kecil hingga sangat besar.
set.seed(1)
dat <- data.frame(y = rnorm(10000), x = 100)
library(ggplot)
ggplot(dat, aes(x = x, y = y)) +
geom_point(size= 0.5) +
stat_smooth(method = "gam",
formula = y ~ s(x, bs = "cs"),k=9, col = "black")
Jika k = 25 memberikan kecocokan yang bermanfaat, apakah masuk akal untuk data ini?
bs = "cs"
istilah dalam spline?