Saya sedang membaca materi yang terkait dengan XGBoost. Tampaknya metode ini tidak memerlukan penskalaan variabel karena didasarkan pada pohon dan yang satu ini dapat menangkap pola non-linearitas kompleks, interaksi. Dan itu dapat menangani variabel numerik dan kategoris dan juga tampaknya bahwa variabel redundan tidak terlalu mempengaruhi metode ini.
Biasanya, dalam pemodelan prediktif, Anda dapat melakukan beberapa pilihan di antara semua fitur yang Anda miliki dan Anda juga dapat membuat beberapa fitur baru dari serangkaian fitur yang Anda miliki. Jadi pilih subset fitur berarti Anda berpikir ada beberapa redundansi di set fitur Anda; membuat beberapa fitur baru dari set fitur saat ini berarti Anda melakukan beberapa transformasi fungsional pada fitur Anda saat ini. Kemudian, kedua poin ini harus dibahas dalam XGBoost. Lalu, apakah itu berarti bahwa untuk menggunakan XGBoost, Anda hanya perlu memilih parameter tunning itu dengan bijak? Apa nilai melakukan rekayasa fitur menggunakan XGBoost?