Pertanyaan yang diberi tag «random-forest»

Hutan acak adalah metode pembelajaran mesin yang menggabungkan hasil dari banyak pohon keputusan.

1
RandomForest dan bobot kelas
Pertanyaan dalam satu kalimat: Apakah ada yang tahu cara menentukan bobot kelas yang baik untuk hutan acak? Penjelasan: Saya bermain-main dengan dataset yang tidak seimbang. Saya ingin menggunakan Rpaket randomForestuntuk melatih model pada dataset yang sangat miring dengan hanya sedikit contoh positif dan banyak contoh negatif. Saya tahu, ada metode …
11 r  random-forest 

1
Mengapa banyak pilihan K menurunkan nilai validasi silang saya?
Bermain-main dengan Boston Housing Dataset dan RandomForestRegressor(parameter w / default) di scikit-belajar, saya melihat sesuatu yang aneh: skor validasi silang menurun ketika saya meningkatkan jumlah lipatan di atas 10. Strategi validasi silang saya adalah sebagai berikut: cv_met = ShuffleSplit(n_splits=k, test_size=1/k) scores = cross_val_score(est, X, y, cv=cv_met) ... di mana num_cvsbervariasi. …

2
Pohon Keputusan dan Regresi - Dapatkah nilai prediksi berada di luar kisaran data pelatihan?
Dalam hal pohon keputusan, dapatkah nilai yang diprediksi berada di luar kisaran data pelatihan? Sebagai contoh, jika rentang set data pelatihan dari variabel target adalah 0-100, ketika saya membuat model dan menerapkannya pada hal lain, dapatkah nilai saya menjadi -5? atau 150? Mengingat bahwa pemahaman saya tentang regresi pohon keputusan …

2
Pengambilan sampel dengan penggantian dalam R randomForest
Implementasi randomForest tidak memungkinkan pengambilan sampel melebihi jumlah pengamatan, bahkan ketika pengambilan sampel dengan penggantian. Kenapa ini? Bekerja dengan baik: rf <- randomForest(Species ~ ., iris, sampsize=c(1, 1, 1), replace=TRUE) rf <- randomForest(Species ~ ., iris, sampsize=3, replace=TRUE) Apa yang ingin saya lakukan: rf <- randomForest(Species ~ ., iris, sampsize=c(51, …

2
MCMC pengambilan sampel ruang pohon keputusan vs. hutan acak
Sebuah hutan random adalah kumpulan pohon keputusan dibentuk oleh acak memilih hanya fitur tertentu untuk membangun setiap pohon dengan (dan kadang-kadang mengantongi data training). Tampaknya mereka belajar dan menggeneralisasi dengan baik. Adakah yang melakukan pengambilan sampel MCMC pada ruang pohon keputusan atau membandingkannya dengan hutan acak? Saya tahu mungkin lebih …


2
Apakah ada cara untuk menjelaskan prediksi dari model hutan acak?
Katakanlah saya punya model klasifikasi prediksi berdasarkan hutan acak (menggunakan paket randomForest di R). Saya ingin mengaturnya agar pengguna akhir dapat menentukan item untuk menghasilkan prediksi, dan itu akan menampilkan kemungkinan klasifikasi. Sejauh ini, tidak masalah. Tetapi akan berguna / keren untuk dapat menampilkan sesuatu seperti grafik kepentingan variabel, tetapi …

2
Mengapa pohon kantong / pohon hutan acak memiliki bias yang lebih tinggi daripada pohon keputusan tunggal?
Jika kita mempertimbangkan pohon keputusan yang tumbuh penuh (yaitu pohon keputusan yang tidak ditandai), ia memiliki varian yang tinggi dan bias yang rendah. Hutan Bagging dan Random menggunakan model varians tinggi ini dan menggabungkannya untuk mengurangi varians dan dengan demikian meningkatkan akurasi prediksi. Baik Hutan Bagging dan Acak menggunakan sampling …



1
Bagaimana cara menghitung skor kepercayaan dalam regresi (dengan hutan acak / XGBoost) untuk setiap prediksi dalam R?
Apakah ada cara untuk mendapatkan skor kepercayaan (kita dapat menyebutnya juga nilai kepercayaan atau kemungkinan) untuk setiap nilai yang diprediksi saat menggunakan algoritma seperti Random Forests atau Extreme Gradient Boosting (XGBoost)? Katakanlah skor kepercayaan ini akan berkisar dari 0 hingga 1 dan menunjukkan seberapa yakin saya tentang prediksi tertentu . …

1
Haruskah saya memilih pengoreksi atau pengelompokan Hutan Acak?
Saya cocok dengan dataset dengan kelas target biner oleh hutan acak. Dengan python, saya bisa melakukannya dengan randomforestclassifier atau randomforestregressor. Saya bisa mendapatkan klasifikasi langsung dari randomforestclassifier atau saya bisa menjalankan randomforestregressor terlebih dahulu dan mendapatkan kembali satu set nilai yang diestimasi (nilai kontinu). Kemudian saya dapat menemukan nilai cutoff …


2
Hutan acak pada data yang dikelompokkan
Saya menggunakan hutan acak pada data kelompok berdimensi tinggi (50 variabel input numerik) yang memiliki struktur hierarki. Data dikumpulkan dengan 6 replikasi pada 30 posisi dari 70 objek berbeda yang menghasilkan 12600 titik data, yang tidak independen. Tampaknya hutan acak terlalu pas data, karena kesalahan oob jauh lebih kecil dari …

2
Performa yang lebih baik menggunakan Random Forest one-Vs-All daripada Random Forest multiclass?
Saya sedang mengerjakan masalah multiclass dengan 9 kemungkinan label, yang mana saya memiliki dataset yang terdiri dari ~ 50.000 contoh dan ~ 200 fitur masing-masing. Setiap contoh hanya dapat dimiliki oleh satu kelas. Data cukup seimbang di antara label yang berbeda. Mengingat kekokohan dan skalabilitasnya, saya memutuskan untuk menggunakan Random …

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.