Saya sering menemukan diri saya melatih beberapa model prediktif berbeda menggunakan caret
R. Saya akan melatih mereka semua pada lipatan validasi silang yang sama, menggunakan caret::: createFolds
, kemudian memilih model terbaik berdasarkan kesalahan lintas-divalidasi.
Namun, prediksi median dari beberapa model sering mengungguli model tunggal terbaik pada set tes independen. Saya sedang berpikir untuk menulis beberapa fungsi untuk model susun / ensembling caret yang dilatih dengan lipatan validasi silang yang sama, misalnya dengan mengambil prediksi median dari masing-masing model pada setiap lipatan, atau dengan melatih "model-meta."
Tentu saja, ini mungkin memerlukan loop validasi silang luar. Apakah ada yang tahu tentang paket yang ada / kode sumber terbuka untuk model caret ensembling (dan mungkin memvalidasi lintas ansambel tersebut)?