Tal,
Secara umum, pemangkasan akan merusak kinerja pohon kantong.
Tress adalah pengklasifikasi yang tidak stabil; yang berarti bahwa jika Anda sedikit mengganggu data, pohon mungkin akan berubah secara signifikan. Mereka bias rendah tetapi model varians tinggi. Bagging umumnya bekerja dengan "mereplikasi" model untuk menurunkan varians (trik lama "tambah ukuran sampel Anda").
Namun, jika Anda akhirnya mendapatkan rata-rata model yang sangat mirip, maka Anda tidak mendapatkan banyak. Jika pohon tidak dipangkas, mereka cenderung lebih berbeda satu sama lain daripada jika dipangkas. Ini memiliki efek "menghiasi" pohon sehingga Anda rata-rata pohon yang tidak terlalu mirip. Ini juga merupakan alasan bahwa hutan acak menambahkan perubahan tambahan dari pemilihan prediktor acak. Itu memaksa pohon menjadi sangat berbeda.
Menggunakan pohon yang tidak ditandai akan meningkatkan risiko overfiting, tetapi memodelkan rata-rata lebih dari offset ini (secara umum).
HTH,
Maks