Saya mulai mencoba-coba penggunaan glmnet
dengan LASSO Regression di mana hasil yang saya minati menjadi dikotomis. Saya telah membuat bingkai data mock kecil di bawah ini:
age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7)
gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0)
bmi_p <- c(0.86, 0.45, 0.99, 0.84, 0.85, 0.67, 0.91, 0.29, 0.88)
m_edu <- c(0, 1, 1, 2, 2, 3, 2, 0, 1)
p_edu <- c(0, 2, 2, 2, 2, 3, 2, 0, 0)
f_color <- c("blue", "blue", "yellow", "red", "red", "yellow", "yellow",
"red", "yellow")
asthma <- c(1, 1, 0, 1, 0, 0, 0, 1, 1)
# df is a data frame for further use!
df <- data.frame(age, gender, bmi_p, m_edu, p_edu, f_color, asthma)
Kolom (variabel) dalam dataset di atas adalah sebagai berikut:
age
(usia anak dalam tahun) - terus menerusgender
- biner (1 = laki-laki; 0 = perempuan)bmi_p
(Persentase BMI) - kontinyum_edu
(tingkat pendidikan tertinggi ibu) - ordinal (0 = kurang dari sekolah tinggi; 1 = ijazah sekolah tinggi; 2 = gelar sarjana; 3 = gelar pasca sarjana muda)p_edu
(tingkat pendidikan tertinggi ayah) - ordinal (sama dengan m_edu)f_color
(warna primer favorit) - nominal ("biru", "merah", atau "kuning")asthma
(status asma anak) - biner (1 = asma; 0 = tidak ada asma)
Tujuan dari contoh ini adalah untuk memanfaatkan Lasso untuk membuat model memprediksi Status asma anak dari daftar 6 variabel prediktor potensial ( age
, gender
, bmi_p
, m_edu
, p_edu
, dan f_color
). Jelas ukuran sampel adalah masalah di sini, tetapi saya berharap untuk mendapatkan lebih banyak wawasan tentang bagaimana menangani berbagai jenis variabel (yaitu, kontinu, ordinal, nominal, dan biner) dalam glmnet
kerangka kerja ketika hasilnya adalah biner (1 = asma ; 0 = tidak ada asma).
Dengan demikian, apakah ada orang yang bersedia memberikan R
skrip sampel bersama dengan penjelasan untuk contoh tiruan ini menggunakan LASSO dengan data di atas untuk memprediksi status asma? Meskipun sangat mendasar, saya tahu saya, dan kemungkinan banyak orang lain di CV, akan sangat menghargai ini!
glmnet
dalam aksi dengan hasil biner.
dput
suatu yang sebenarnya objek R; jangan membuat pembaca menaruh hiasan di atasnya dan juga membuatkan kue untuk Anda !. Jika Anda menghasilkan bingkai data yang sesuai di R, katakanfoo
, lalu edit ke pertanyaan hasil daridput(foo)
.