Saya mencoba membuat model yang diperkecil untuk memprediksi banyak variabel dependen (DV) (~ 450) yang sangat berkorelasi.
Variabel independen saya (IV) juga banyak (~ 2000) dan sangat berkorelasi.
Jika saya menggunakan laso untuk memilih model yang direduksi untuk setiap output secara terpisah, saya tidak dijamin mendapatkan subset variabel independen yang sama seperti saya mengulangi setiap variabel dependen.
Apakah ada regresi linier multivariat yang menggunakan laso di R?
Ini bukan grup laso. kelompok laso mengelompokkan IV. Saya ingin regresi linier multivariat (artinya DV adalah matriks, bukan vektor skalar), yang juga menerapkan laso. (Catatan: seperti yang ditunjukkan NRH, ini tidak benar. Grup laso adalah istilah umum yang mencakup strategi yang mengelompokkan IV, tetapi juga mencakup strategi yang mengelompokkan parameter lain seperti DV)
Saya menemukan makalah ini yang masuk ke sesuatu yang disebut Sparse Overlapping Sets Lasso
Berikut adalah beberapa kode yang melakukan regresi linier multivariat
> dim(target)
[1] 6060 441
> dim(dictionary)
[1] 6060 2030
> fit = lm(target~dictionary)
Berikut adalah beberapa kode yang melakukan laso pada DV tunggal
> fit = glmnet(dictionary, target[,1])
Dan inilah yang ingin saya lakukan:
> fit = glmnet(dictionary, target)
Error in weighted.mean.default(y, weights) :
'x' and 'w' must have the same length
Memilih fitur yang sesuai SEMUA target sekaligus
glmnet
dan memiliki sketsa menyeluruh.