Saya menggunakan caret
paket R
untuk pelatihan pengklasifikasi biner SVM. Untuk pengurangan fitur, saya melakukan preprocessing dengan PCA menggunakan fitur preProc=c("pca")
bawaan saat menelepon train()
. Ini pertanyaan saya:
- Bagaimana caret memilih komponen utama?
- Apakah ada sejumlah komponen utama yang dipilih?
- Apakah komponen utama dipilih oleh sejumlah varian yang dijelaskan (mis. 80%)?
- Bagaimana saya bisa mengatur jumlah komponen utama yang digunakan untuk klasifikasi?
- (Saya mengerti bahwa PCA harus menjadi bagian dari validasi silang luar untuk memungkinkan perkiraan prediksi yang dapat diandalkan.) Haruskah PCA juga diimplementasikan dalam siklus validasi silang dalam (estimasi parameter)?
- Bagaimana caret mengimplementasikan PCA dalam cross-validation?
Informasi yang berguna dapat ditemukan di postingan ini pada PCA dan k-fold cross-validasi dalam paket sisipan di R .
—
Ekaba Bisong