Apakah mungkin untuk menghitung AIC dan BIC untuk model regresi laso?


31

Apakah mungkin untuk menghitung nilai AIC atau BIC untuk model regresi laso dan model yang diregulasi lainnya di mana parameter hanya sebagian memasukkan persamaan. Bagaimana seseorang menentukan derajat kebebasan?

Saya menggunakan R agar sesuai dengan model regresi laso dengan glmnet()fungsi dari glmnetpaket, dan saya ingin tahu bagaimana menghitung nilai AIC dan BIC untuk model. Dengan cara ini saya dapat membandingkan nilai dengan model yang sesuai tanpa regularisasi. Apakah ini mungkin dilakukan?


1
Ya, Anda bisa melakukan ini, tetapi kemungkinan besar mengharuskan Anda untuk mendapatkan koreksi yang tepat. Koreksi ini diturunkan dalam makalah ini ncbi.nlm.nih.gov/pmc/articles/PMC2629611 dalam konteks pemodelan campuran terbatas yang dihukum, tetapi argumen analog akan cukup dalam model hukuman lainnya.
Makro

Jawaban:



10

Saya banyak berjuang dengan cara bagaimana menghitung AIC dan BIC untuk model glmnet. Namun, setelah cukup banyak mencari, saya menemukan jawabannya di halaman ketiga google. Itu dapat ditemukan di sini . Saya memposting di sini untuk pembaca masa depan karena saya percaya saya tidak bisa menjadi satu-satunya.

Pada akhirnya, saya menerapkan AIC dan BIC dengan cara berikut:

fit <- glmnet(x, y, family = "multinomial") 

tLL <- fit$nulldev - deviance(fit)
k <- fit$df
n <- fit$nobs
AICc <- -tLL+2*k+2*k*(k+1)/(n-k-1)
AICc

BIC<-log(n)*k - tLL
BIC

2

Dalam tautan yang dirujuk oleh johnnyheineken, penulis menyatakan:

Saya khawatir dua kuantitas yang tersedia dari objek glmnet (dev.ratio, nulldev) tidak cukup untuk mendapatkan kemungkinan model, yang Anda perlukan untuk menghitung AICc. Anda memiliki dua persamaan dalam tiga yang tidak diketahui: likelihood (null), likelihood (model), dan likelihood (saturated). Saya tidak bisa mendapatkan kemungkinan (model) gratis dari kemungkinan (nol).

Menurut saya, jika Anda membandingkan AIC antara dua model, fakta bahwa Anda tidak dapat memisahkan penyimpangan nol seharusnya tidak menjadi masalah. Karena ada di kedua "sisi" ketidaksetaraan, itu akan menunjukkan model mana yang harus memiliki AIC lebih rendah. Ini tergantung pada dua hal:

  1. Data sama di kedua model (toh diperlukan untuk perbandingan AIC)
  2. Saya tidak melupakan sesuatu dari Stat101 atau aljabar sekolah menengah (asumsi kuat yang diberikan asupan kafein saya saat ini)
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.