Misalkan kita memiliki dua pohon regresi (pohon A dan pohon B) yang peta masukan untuk output y ∈ R . Biarkan y = f A ( x ) untuk pohon A dan f B ( x ) untuk pohon B. Setiap pohon menggunakan perpecahan biner, dengan hyperplanes sebagai fungsi memisahkan.
Sekarang, anggaplah kita mengambil jumlah tertimbang dari output pohon:
Apakah fungsi setara dengan pohon regresi tunggal (lebih)? Jika jawabannya "kadang-kadang", maka dalam kondisi apa?
Idealnya, saya ingin memungkinkan hyperplanes miring (yaitu pemisahan dilakukan pada kombinasi fitur linear). Tapi, dengan asumsi pemisahan fitur tunggal bisa ok jika itu satu-satunya jawaban yang tersedia.
Contoh
Berikut adalah dua pohon regresi yang didefinisikan pada ruang input 2d:
Gambar menunjukkan bagaimana setiap partisi partisi ruang input, dan output untuk setiap wilayah (kode dalam skala abu-abu). Angka berwarna menunjukkan daerah ruang input: 3,4,5,6 sesuai dengan node daun. 1 adalah penyatuan 3 & 4, dll.
Sekarang anggaplah kita rata-rata output pohon A dan B:
Output rata-rata diplot di sebelah kiri, dengan batas keputusan pohon A dan B ditumpangkan. Dalam hal ini, dimungkinkan untuk membuat pohon tunggal yang lebih dalam yang outputnya setara dengan rata-rata (diplot di sebelah kanan). Setiap node sesuai dengan wilayah ruang input yang dapat dibangun dari wilayah yang ditentukan oleh pohon A dan B (ditunjukkan oleh angka berwarna pada setiap node; beberapa angka menunjukkan persimpangan dua wilayah). Perhatikan bahwa pohon ini tidak unik - kita bisa mulai membangun dari pohon B alih-alih pohon A.
Contoh ini menunjukkan bahwa ada kasus di mana jawabannya adalah "ya". Saya ingin tahu apakah ini selalu benar.