Saya memiliki set data besar yang terdiri dari nilai beberapa ratus variabel keuangan yang dapat digunakan dalam regresi berganda untuk memprediksi perilaku dana indeks dari waktu ke waktu. Saya ingin mengurangi jumlah variabel menjadi sepuluh atau lebih sambil tetap mempertahankan kekuatan prediksi sebanyak mungkin. Ditambahkan: Rangkaian variabel yang dikurangi harus merupakan himpunan bagian dari set variabel asli untuk menjaga makna ekonomi dari variabel asli. Jadi, misalnya, saya tidak boleh berakhir dengan kombinasi linear atau agregat dari variabel asli.
Beberapa (mungkin naif) pemikiran tentang bagaimana melakukan ini:
- Lakukan regresi linier sederhana dengan setiap variabel dan pilih sepuluh dengan nilai . Tentu saja, tidak ada jaminan bahwa sepuluh variabel individu terbaik yang digabungkan akan menjadi kelompok sepuluh terbaik.
- Lakukan analisis komponen utama dan cobalah untuk menemukan sepuluh variabel asli dengan asosiasi terbesar dengan beberapa sumbu utama pertama.
Saya tidak berpikir saya bisa melakukan regresi hirarkis karena variabel tidak benar-benar bersarang. Mencoba semua kombinasi yang mungkin dari sepuluh variabel secara komputasi tidak mungkin karena ada terlalu banyak kombinasi.
Apakah ada pendekatan standar untuk mengatasi masalah ini mengurangi jumlah variabel dalam regresi berganda?
Sepertinya ini akan menjadi masalah yang cukup umum sehingga akan ada pendekatan standar.
Jawaban yang sangat membantu adalah jawaban yang tidak hanya menyebutkan metode standar tetapi juga memberikan tinjauan umum tentang bagaimana dan mengapa ia bekerja. Atau, jika tidak ada satu pendekatan standar tetapi lebih dari satu pendekatan dengan kekuatan dan kelemahan yang berbeda, jawaban yang sangat membantu akan menjadi salah satu yang membahas pro dan kontra mereka.
Komentar whuber di bawah ini menunjukkan bahwa permintaan pada paragraf terakhir terlalu luas. Sebagai gantinya, saya akan menerima sebagai jawaban yang baik daftar pendekatan utama, mungkin dengan deskripsi masing-masing yang sangat singkat. Setelah saya memiliki persyaratan, saya bisa menggali rinciannya masing-masing.