Adakah yang bisa menjelaskan perbedaan antara RandomForestClassifier dan ExtraTreesClassifier di scikit learn. Saya telah menghabiskan sedikit waktu membaca koran:
P. Geurts, D. Ernst., Dan L. Wehenkel, "Pohon yang sangat diacak", Machine Learning, 63 (1), 3-42, 2006
Tampaknya inilah perbedaan untuk ET:
1) Saat memilih variabel secara terpisah, sampel diambil dari seluruh set pelatihan, bukan sampel bootstrap dari set pelatihan.
2) Pemisahan dipilih sepenuhnya secara acak dari kisaran nilai dalam sampel di setiap pemisahan.
Hasil dari dua hal ini adalah lebih banyak "daun".