Bagaimana cara menginterpretasikan plot cv.glmnet ()?

Saya melakukan laso dan kemudian meninggalkan validasi silang keluar-keluar

cv<-cv.glmnet(df, df$Price, nfolds = 1500)

Ketika saya merencanakan cv saya mendapatkan yang berikut:

Saya juga memperhatikan bahwa saya mendapatkan 2 lambda berbeda: lambda.mindanlambda.1se

Apa perbedaan antara lambda ini?
Apa yang bisa saya pahami dari plot di atas secara umum (apa interval kepercayaan ini, apa dua garis putus-putus dll)?

Jika saya mengubah untuk nfolds=10melakukan validasi 10 kali lipat, saya mendapatkan lambda.1sekoefisien yang berbeda dan berbeda untuk lambda ini. Berdasarkan kriteria apa saya dapat memilih yang terbaik untuk saya?

r cross-validation interpretation lasso

— Melati
sumber

Sudahkah Anda mencoba mencari di sini: web.stanford.edu/~hastie/glmnet/glmnet_alpha.html

— ilanman

@ilanman Bagus sekali, terima kasih! Tapi tetap saja lambda mana yang harus saya sukai? Intuisi saya akan mengatakan lambda.min tetapi saya melihat bahwa lambda.1se biasanya disarankan ..

— Jasmine

Ini bukan tentang statistik, hanya membaca dokumentasi.

Dua nilai berbeda dari $\lambda$ mencerminkan dua pilihan umum untuk $\lambda$ . Itu $\lambda_{\min}$ adalah salah satu yang meminimalkan kehilangan sampel di CV. The adalah salah satu yang terbesar nilai dalam 1 standard error . Satu baris penalaran menyarankan penggunaan karena lindung nilai terhadap overfitting dengan memilih nilai besar daripada min. Pilihan mana yang terbaik tergantung pada konteks. $\lambda_{1se}$ $\lambda$ $\lambda_{\min}$ $\lambda_{1se}$ $\lambda$
Interval kepercayaan mewakili perkiraan kesalahan untuk metrik kerugian (titik merah). Mereka dihitung menggunakan CV. Garis vertikal menunjukkan lokasi dan . Angka-angka di atas adalah jumlah estimasi koefisien bukan nol. $\lambda_{\min}$ $\lambda_{1se}$

— Sycorax berkata Reinstate Monica
sumber