Saya menemukan pertanyaan sederhana tentang membandingkan model yang fleksibel (yaitu splines) vs model yang tidak fleksibel (misalnya regresi linier) di bawah skenario yang berbeda. Pertanyaannya adalah:
Secara umum, apakah kita mengharapkan kinerja metode pembelajaran statistik yang fleksibel untuk melakukan lebih baik atau lebih buruk daripada metode yang tidak fleksibel ketika:
- Jumlah prediktor sangat besar, dan jumlah pengamatan kecil? n
- Varian dari istilah kesalahan, yaitu , sangat tinggi?
Saya pikir untuk (1), ketika kecil, model tidak fleksibel lebih baik (tidak yakin). Untuk (2), saya tidak tahu model mana yang (relatif) lebih baik.