Ada beberapa alternatif untuk Regresi Stepwise . Yang paling sering saya lihat adalah:
- Pendapat ahli untuk memutuskan variabel mana yang akan dimasukkan dalam model.
- Regresi Kotak Terkecil Sebagian . Anda pada dasarnya mendapatkan variabel laten dan melakukan regresi dengannya. Anda juga bisa melakukan PCA sendiri dan kemudian menggunakan variabel utama.
- Penyusutan dan Seleksi Absolut Mutlak (LASSO).
Baik Regresi PLS dan LASSO diimplementasikan dalam paket R seperti
PLS : http://cran.r-project.org/web/packages/pls/ dan
LARS : http://cran.r-project.org/web/packages/lars/index.html
Jika Anda hanya ingin menjelajahi hubungan antara variabel dependen Anda dan variabel independen (mis. Anda tidak memerlukan tes signifikansi statistik), saya juga akan merekomendasikan metode Pembelajaran Mesin seperti Hutan Acak atau Pohon Klasifikasi / Regresi . Random Forests juga dapat memperkirakan hubungan non-linear yang kompleks antara variabel dependen dan independen Anda, yang mungkin tidak terungkap oleh teknik linear (seperti Regresi Linier ).
Titik awal yang baik untuk Pembelajaran Mesin mungkin adalah tampilan tugas Pembelajaran Mesin pada CRAN:
Tampilan Tugas Pembelajaran Mesin : http://cran.r-project.org/web/views/MachineLearning.html