Saya tidak mengerti persis apa yang dimaksud dengan ukuran simpul. Saya tahu apa itu simpul keputusan, tetapi bukan apa ukuran simpul itu.
Saya tidak mengerti persis apa yang dimaksud dengan ukuran simpul. Saya tahu apa itu simpul keputusan, tetapi bukan apa ukuran simpul itu.
Jawaban:
Pohon keputusan bekerja dengan partisi rekursif dari set pelatihan. Setiap node dari pohon keputusan dikaitkan dengan satu set titik data dari set pelatihan:
Anda mungkin menemukan parameter nodesize
di beberapa paket forest acak, misalnya R : Ini adalah ukuran simpul minimum , dalam contoh di atas ukuran simpul minimum adalah 10. Parameter ini secara implisit menentukan kedalaman pohon Anda.
nodesize
dari paket R random forest
Ukuran minimum terminal node. Menetapkan jumlah ini lebih besar menyebabkan pohon yang lebih kecil tumbuh (dan karenanya membutuhkan waktu lebih sedikit). Perhatikan bahwa nilai default berbeda untuk klasifikasi (1) dan regresi (5).
Dalam paket lain Anda langsung menemukan parameter depth
, misalnya WEKA :
-depth
dari paket hutan acak WEKA
Kedalaman maksimum pohon, 0 untuk tidak terbatas. (default 0)
Tidak jelas apakah nodesize berada pada sampling "in-bag" atau kesalahan "out-of-bag". Jika ada pada pengambilan sampel "out-of-bag", itu sedikit lebih ketat.