[NB: Lihat pembaruan 1 di bawah.] Saya menemukan metodologi untuk rpart
jauh lebih mudah untuk dijelaskan daripada party
. Yang terakhir, bagaimanapun, jauh lebih canggih dan cenderung memberikan model yang lebih baik. Cara saya kadang-kadang menjelaskan party
adalah dengan menyebutnya sebagai dasar untuk memproduksi model linear lokal (atau GLM). Saya membangun ini dengan menunjukkan hasil untukrpart
adalah konstan di semua elemen yang jatuh ke simpul daun, yaitu kotak / wilayah yang dibatasi oleh pemisahan. Bahkan jika mungkin ada perbaikan melalui model lokal, Anda tidak mendapatkan apa pun selain prediksi konstan.
Sebaliknya, party
mengembangkan pemisahan untuk berpotensi mengoptimalkan model untuk daerah. Ini sebenarnya menggunakan kriteria yang berbeda dari optimalitas model, tetapi Anda perlu mengukur kapasitas Anda sendiri untuk menjelaskan perbedaan untuk menentukan apakah Anda dapat menjelaskannya dengan baik. Makalah untuk itu cukup mudah diakses oleh seorang peneliti, tetapi mungkin cukup menantang bagi seseorang yang tidak mau mempertimbangkan metode yang lebih sederhana seperti hutan acak, meningkatkan, dll. Secara matematis, saya berpikir bahwaparty
lebih canggih ... Meskipun demikian, model CART lebih mudah untuk menjelaskan, baik dalam hal metodologi dan hasil, dan ini memberikan batu loncatan yang layak untuk memperkenalkan model berbasis pohon yang lebih canggih.
Singkatnya, saya akan mengatakan bahwa Anda harus melakukan rpart
untuk kejelasan, dan Anda dapat menggunakan party
untuk akurasi / kinerja, tetapi saya tidak akan memperkenalkan party
tanpa memperkenalkanrpart
.
Pembaruan 1. Saya mendasarkan jawaban saya pada pemahaman saya party
seperti satu atau dua tahun yang lalu. Ini telah tumbuh sedikit, tetapi saya akan memodifikasi jawaban saya untuk mengatakan bahwa saya masih merekomendasikan rpart
untuk singkatnya dan warisannya, jika "tidak suka" menjadi kriteria penting bagi klien / kolaborator Anda. Namun, saya akan mencoba bermigrasi untuk menggunakan lebih banyak fungsi dari party
, setelah memperkenalkan seseorang rpart
. Lebih baik memulai dari yang kecil, dengan fungsi kerugian, kriteria pemisahan, dll., Dalam konteks yang sederhana, sebelum memperkenalkan paket dan metodologi yang melibatkan konsep yang jauh lebih terlibat.