Dalam semua kertas hutan acak (regresi) yang saya baca, ketika tiba saatnya untuk mengumpulkan prediksi semua pohon, kami mengambil nilai rata-rata sebagai prediksi.
Pertanyaan saya adalah mengapa kita melakukan itu?
Apakah ada justifikasi statistik untuk mengambil rata-rata?
EDIT: Untuk mengklarifikasi pertanyaan, saya tahu dimungkinkan untuk menggunakan fungsi agregasi lainnya (kami menggunakan mode untuk klasifikasi), saya lebih tertarik pada apakah ada beberapa pembenaran teoretis di balik pilihan fungsi rata-rata.