Saya menyadari bahwa ada 3 parameter penyetelan dalam model meningkatkan pohon, yaitu
- jumlah pohon (jumlah iterasi)
- parameter penyusutan
- jumlah pemisahan (ukuran masing-masing pohon penyusun)
Pertanyaan saya adalah: untuk setiap parameter penyetelan, bagaimana saya harus menemukan nilai optimalnya? Dan metode apa?
Perhatikan bahwa: parameter susut dan jumlah parameter pohon beroperasi bersama, yaitu nilai yang lebih kecil untuk parameter penyusutan mengarah ke nilai yang lebih tinggi untuk jumlah pohon. Dan kita perlu memperhitungkan ini juga.
Saya sangat tertarik pada metode untuk menemukan nilai optimal untuk jumlah split. Haruskah itu didasarkan pada validasi silang atau pengetahuan domain tentang model di belakang?
Dan bagaimana hal-hal ini dilakukan dalam gbm
paket di R?