Pertanyaan saya adalah tentang klasifikasi biner, katakanlah memisahkan pelanggan yang baik dari pelanggan yang buruk, tetapi bukan regresi atau klasifikasi non-biner. Dalam konteks ini, hutan acak adalah ansambel pohon klasifikasi. Untuk setiap pengamatan, setiap pohon memilih "ya" atau "tidak", dan suara rata-rata dari semua pohon adalah probabilitas hutan akhir.
Pertanyaan saya adalah tentang memodifikasi perilaku pohon yang mendasarinya: Bagaimana kita bisa memodifikasi fungsi randomForest (dari paket randomForest dari R) sehingga setiap pohon memilih desimal alih-alih biner ya / tidak. Untuk lebih memahami apa yang saya maksud dengan desimal, mari kita pikirkan tentang cara kerja pohon keputusan.
Pohon keputusan yang telah dewasa memiliki 1 instance baik atau 1 buruk di node terminalnya. Asumsikan bahwa saya membatasi ukuran simpul terminal sebagai 100. Kemudian simpul terminal akan terlihat seperti:
Node1 = 80 buruk, 20 baik
Node2 = 51 buruk, 49 baik
Node3 = 10 buruk, 90 bagus
Perhatikan, meskipun Node1 dan Node2 memilih "buruk", "kekuatan kejahatan" mereka sangat berbeda. Itulah yang saya cari. Alih-alih meminta mereka menghasilkan 1 atau 0 (yang merupakan perilaku default) dapatkah seseorang memodifikasi paket R sehingga mereka memilih 80/100, 51/100, 10/100 dll?