Pertanyaan yang diberi tag «model-selection»

Pemilihan model adalah masalah dalam menilai model mana dari beberapa set yang berkinerja terbaik. Metode populer termasukR2, Kriteria AIC dan BIC, set uji, dan validasi silang. Hingga taraf tertentu, pemilihan fitur adalah subproblem dari pemilihan model.


2
Apakah regresi bertahap memberikan estimasi bias populasi r-square?
Dalam bidang psikologi dan bidang lainnya bentuk regresi bertahap sering digunakan yang melibatkan hal-hal berikut: Lihatlah prediktor yang tersisa (tidak ada dalam model pada awalnya) dan identifikasi prediktor yang menghasilkan perubahan r-square terbesar; Jika nilai p dari perubahan r-square kurang dari alpha (biasanya 0,05), maka sertakan prediktor itu dan kembali …

5
Mengapa menerapkan pemilihan model menggunakan AIC memberi saya nilai p tidak signifikan untuk variabel
Saya memiliki beberapa pertanyaan tentang AIC dan berharap Anda dapat membantu saya. Saya menerapkan pemilihan model (mundur, atau maju) berdasarkan AIC pada data saya. Dan beberapa variabel yang dipilih berakhir dengan nilai p> 0,05. Saya tahu bahwa orang-orang mengatakan kita harus memilih model berdasarkan AIC dan bukan nilai-p, jadi sepertinya …

2
Pemilihan model Box-Jenkins
Prosedur pemilihan model Box-Jenkins dalam analisis deret waktu dimulai dengan melihat fungsi autokorelasi dan autokorelasi parsial dari seri tersebut. Plot ini dapat menyarankan dan sesuai dalam model ARMA . Prosedur berlanjut dengan meminta pengguna untuk menerapkan kriteria AIC / BIC untuk memilih model yang paling pelit di antara mereka yang …

1
logloss vs gini / auc
Saya sudah melatih dua model (pengklasifikasi biner menggunakan h2o AutoML) dan saya ingin memilih satu untuk digunakan. Saya memiliki hasil sebagai berikut: model_id auc logloss logloss_train logloss_valid gini_train gini_valid DL_grid_1 0.542694 0.287469 0.092717 0.211956 0.872932 0.312975 DL_grid_2 0.543685 0.251431 0.082616 0.186196 0.900955 0.312662 yang aucdan loglosskolom metrik cross-validasi (validasi silang …

4
Apa gunanya regresi univariat sebelum regresi multivariat?
Saat ini saya sedang mengerjakan masalah di mana kami memiliki dataset kecil dan tertarik pada efek kausalitas dari perawatan pada hasilnya. Penasihat saya telah menginstruksikan saya untuk melakukan regresi univariat pada setiap prediktor dengan hasilnya sebagai respons, kemudian tugas pengobatan sebagai respons. Yaitu, saya diminta untuk menyesuaikan regresi dengan satu …

2
Pendekatan yang bertentangan dengan pemilihan variabel: AIC, nilai-p atau keduanya?
Dari apa yang saya pahami, pemilihan variabel berdasarkan nilai-p (setidaknya dalam konteks regresi) sangat cacat. Tampaknya pemilihan variabel berdasarkan AIC (atau serupa) juga dianggap cacat oleh beberapa, untuk alasan yang sama, meskipun ini tampaknya agak tidak jelas (mis. Lihat pertanyaan saya dan beberapa tautan pada topik ini di sini: Apa …

2
Regresi linier vs nonlinear
Saya memiliki satu set nilai dan yang secara teoritis terkait secara eksponensial:xxxyyy y=axby=axby = ax^b Salah satu cara untuk mendapatkan koefisien adalah dengan menerapkan logaritma natural di kedua sisi dan menyesuaikan model linier: > fit <- lm(log(y)~log(x)) > a <- exp(fit$coefficients[1]) > b <- fit$coefficients[2] Cara lain untuk memperoleh ini …

2
Apa itu tes chunk?
Sebagai jawaban atas pertanyaan tentang pemilihan model di hadapan multikolinieritas , Frank Harrell menyarankan : Masukkan semua variabel dalam model tetapi jangan menguji efek dari satu variabel yang disesuaikan untuk efek variabel yang bersaing ... Tes chunk dari variabel yang bersaing kuat karena variabel collinear bergabung dalam keseluruhan uji derajat …

2
Memahami bootstrap untuk validasi dan pemilihan model
Saya rasa saya mengerti bagaimana dasar-dasar bootstrap bekerja, tapi saya tidak yakin saya mengerti bagaimana saya bisa menggunakan bootstrap untuk pemilihan model atau untuk menghindari overfitting. Untuk pemilihan model, misalnya, apakah Anda hanya memilih model yang menghasilkan kesalahan terendah (mungkin varians?) Di seluruh sampel bootstrapnya? Apakah ada teks yang membahas …

2
Memahami kriteria AIC dan Schwarz
Saya menjalankan model logistik. Dataset model yang sebenarnya memiliki lebih dari 100 variabel, tetapi saya memilih kumpulan data uji yang ada sekitar 25 variabel. Sebelumnya saya juga membuat dataset yang memiliki 8-9 variabel. Saya diberi tahu bahwa nilai AIC dan SC dapat digunakan untuk membandingkan model. Saya mengamati bahwa model …

3
Menggunakan informasi geometri untuk menentukan jarak dan volume ... berguna?
Saya datang di besar tubuh sastra yang menganjurkan menggunakan Informasi Fisher metrik sebagai metrik lokal alami di ruang distribusi probabilitas dan kemudian mengintegrasikan lebih dari itu untuk menentukan jarak dan volume. Tetapi apakah jumlah "terintegrasi" ini sebenarnya berguna untuk apa saja? Saya tidak menemukan pembenaran teoretis dan sedikit sekali aplikasi …


1
Bagaimana cara membandingkan model berdasarkan AIC?
Kami memiliki dua model yang menggunakan metode yang sama untuk menghitung kemungkinan log dan AIC untuk satu lebih rendah dari yang lain. Namun, yang dengan AIC lebih rendah jauh lebih sulit untuk ditafsirkan. Kami mengalami masalah dalam memutuskan apakah layak untuk memperkenalkan kesulitan dan kami menilai ini menggunakan perbedaan persentase …

1
Jelaskan langkah-langkah algoritma LLE (local linear embedding)?
Saya mengerti prinsip dasar di balik algoritma untuk LLE terdiri dari tiga langkah. Menemukan lingkungan setiap titik data dengan beberapa metrik seperti k-nn. Temukan bobot untuk setiap tetangga yang menunjukkan efek yang dimiliki tetangga pada titik data. Bangun penyisipan data dimensi rendah berdasarkan bobot yang dihitung. Tetapi penjelasan matematis dari …

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.