The definisi parameter min_child_weight di xgboost diberikan sebagai:
jumlah minimum contoh berat badan (goni) yang dibutuhkan pada anak. Jika langkah partisi pohon menghasilkan simpul daun dengan jumlah bobot contoh kurang dari min_child_weight, maka proses pembangunan akan berhenti mempartisi lebih lanjut. Dalam mode regresi linier, ini hanya sesuai dengan jumlah minimum instance yang diperlukan di setiap node. Semakin besar, algoritma akan semakin konservatif.
Saya telah membaca beberapa hal di xgboost termasuk kertas asli (lihat rumus 8 dan yang baru setelah persamaan 9), pertanyaan ini dan banyak hal yang berkaitan dengan xgboost yang muncul di beberapa halaman pertama pencarian google. ;)
Pada dasarnya saya masih tidak senang mengapa kita memaksakan batasan jumlah hessian? Saya hanya berpikir pada menit dari kertas asli adalah bahwa hal itu berkaitan dengan bagian tertimbang kuantil sketsa (dan reformulasi sebagai persamaan 3 hilangnya kuadrat tertimbang) yang memiliki sebagai 'bobot' dari setiap contoh.
Pertanyaan selanjutnya berkaitan dengan mengapa itu hanya jumlah contoh dalam mode regresi linier? Saya kira ini terkait dengan turunan kedua dari persamaan jumlah kuadrat?