Saya mencoba menyelesaikan serangkaian persamaan yang memiliki 40 variabel independen (x1, ..., x40) dan satu variabel dependen (y). Jumlah total persamaan (jumlah baris) adalah ~ 300, dan saya ingin menyelesaikan set 40 koefisien yang meminimalkan total jumlah kesalahan kuadrat antara y dan nilai prediksi.
Masalah saya adalah bahwa matriks sangat jarang dan saya tidak tahu cara terbaik untuk menyelesaikan sistem persamaan dengan data jarang. Contoh dataset ditunjukkan di bawah ini:
y x1 x2 x3 x4 x5 x6 ... x40
87169 14 0 1 0 0 2 ... 0
46449 0 0 4 0 1 4 ... 12
846449 0 0 0 0 0 3 ... 0
....
Saat ini saya menggunakan Algoritma Genetika untuk menyelesaikan ini dan hasilnya keluar dengan faktor sekitar dua perbedaan antara yang diamati dan yang diharapkan.
Adakah yang bisa menyarankan metode atau teknik yang berbeda yang mampu memecahkan satu set persamaan dengan data jarang.