Gagasan utamanya adalah prosedur mengantongi, bukan membuat pohon acak. Secara rinci, setiap pohon dibangun di atas sampel objek yang digambar dengan penggantian dari set aslinya; dengan demikian setiap pohon memiliki beberapa objek yang belum dilihatnya, yang membuat keseluruhan ansambel lebih heterogen dan dengan demikian lebih baik dalam generalisasi.
Lebih jauh, pohon-pohon dilemahkan sedemikian rupa sehingga pada setiap pemisahan hanya M (atau mtry
) atribut yang dipilih secara acak yang dipertimbangkan; M biasanya merupakan akar kuadrat dari jumlah atribut dalam himpunan. Ini memastikan bahwa pohon-pohonnya kurang dilengkapi, karena mereka tidak dipangkas. Anda dapat menemukan detail lebih lanjut di sini .
Di sisi lain, ada varian RF yang disebut Extreme Random Forest, di mana pohon dibuat secara acak (tidak ada optimasi pemisahan) - lihat, saya pikir referensi ini .