Sebuah hutan random adalah kumpulan pohon keputusan dibentuk oleh acak memilih hanya fitur tertentu untuk membangun setiap pohon dengan (dan kadang-kadang mengantongi data training). Tampaknya mereka belajar dan menggeneralisasi dengan baik. Adakah yang melakukan pengambilan sampel MCMC pada ruang pohon keputusan atau membandingkannya dengan hutan acak? Saya tahu mungkin lebih mahal secara komputasi untuk menjalankan MCMC dan menyimpan semua pohon sampel, tetapi saya tertarik pada fitur teoritis dari model ini, bukan biaya komputasi. Maksud saya adalah sesuatu seperti ini:
- Bangun pohon keputusan acak (Ini mungkin akan melakukan mengerikan)
- Hitung kemungkinan pohon dengan sesuatu seperti , atau mungkin tambahkan istilah .
- Pilih langkah acak untuk mengubah pohon dan pilih berdasarkan kemungkinan .
- Setiap N langkah, simpan salinan pohon saat ini
- Kembali ke 3 untuk beberapa kali N * M besar
- Gunakan koleksi pohon M diselamatkan untuk melakukan prediksi
Apakah ini akan memberikan kinerja yang mirip dengan Hutan Acak? Perhatikan bahwa di sini kita tidak membuang data atau fitur yang baik pada langkah apa pun seperti hutan acak.