Pertanyaan yang diberi tag «model-selection»

Pemilihan model adalah masalah dalam menilai model mana dari beberapa set yang berkinerja terbaik. Metode populer termasukR2, Kriteria AIC dan BIC, set uji, dan validasi silang. Hingga taraf tertentu, pemilihan fitur adalah subproblem dari pemilihan model.

3
Kapan tepat untuk memilih model dengan meminimalkan AIC?
Sudah mapan, setidaknya di antara ahli statistik dari beberapa kaliber lebih tinggi, bahwa model dengan nilai-nilai statistik AIC dalam batas tertentu dari nilai minimum harus dianggap sesuai dengan model meminimalkan statistik AIC. Sebagai contoh, dalam [1, hal.221] kita temukan Maka model dengan GCV kecil atau AIC akan dianggap yang terbaik. …

2
Bagaimana saya harus menangani variabel kategori dengan beberapa level ketika melakukan eliminasi mundur?
Saya sedang melakukan model eliminasi mundur berbasis AIC sederhana di mana beberapa variabel adalah variabel kategori dengan beberapa level. Variabel-variabel ini dimodelkan sebagai seperangkat variabel dummy. Ketika melakukan eliminasi mundur, haruskah saya menghapus semua level variabel secara bersamaan? Atau haruskah saya memperlakukan setiap variabel dummy secara terpisah? Dan mengapa? Sebagai …

1
Pemilihan model Bayesian di PyMC3
Saya menggunakan PyMC3 untuk menjalankan model Bayesian pada data saya. Saya baru untuk pemodelan Bayesian tetapi menurut beberapa posting blog , Wikipedia dan QA dari situs ini, tampaknya menjadi pendekatan yang valid untuk menggunakan faktor Bayes dan kriteria BIC untuk dapat memilih model apa yang paling mewakili data saya (yang …

1
Bagaimana memilih yang paling cocok tanpa data yang terlalu pas? Memodelkan distribusi bimodal dengan fungsi normal N, dll
Saya memiliki distribusi nilai bimodal yang jelas, yang menurut saya cocok. Data dapat cocok dengan 2 fungsi normal (bimodal) atau dengan 3 fungsi normal. Selain itu, ada alasan fisik yang masuk akal untuk menyesuaikan data dengan 3. Semakin banyak parameter yang diperkenalkan, semakin sempurna kesesuaiannya, karena dengan konstanta yang cukup, …

1
Pemilihan model dalam pembelajaran offline vs. online
Saya telah mencoba untuk belajar lebih banyak tentang pembelajaran online akhir-akhir ini (ini benar-benar menarik!), Dan satu tema yang belum saya pahami dengan baik adalah bagaimana memikirkan pemilihan model dalam konteks offline versus online. Secara khusus, misalkan kita melatih classifier sebuah offline, berdasarkan beberapa data fixed set . Kami memperkirakan …


5
Apa yang harus dilakukan dengan variabel collinear
Penafian: Ini untuk proyek pekerjaan rumah. Saya mencoba untuk datang dengan model terbaik untuk harga berlian, tergantung pada beberapa variabel dan saya tampaknya memiliki model yang cukup bagus sejauh ini. Namun saya telah mengalami dua variabel yang jelas collinear: >with(diamonds, cor(data.frame(Table, Depth, Carat.Weight))) Table Depth Carat.Weight Table 1.00000000 -0.41035485 0.05237998 …

1
Pemilihan model ABC
Telah ditunjukkan bahwa pilihan model ABC menggunakan faktor Bayes tidak direkomendasikan karena adanya kesalahan yang berasal dari penggunaan statistik ringkasan. Kesimpulan dalam makalah ini bergantung pada studi tentang perilaku metode populer untuk mendekati faktor Bayes (Algoritma 2). Diketahui bahwa faktor Bayes bukan satu-satunya cara untuk melakukan pemilihan model. Ada fitur …


2
Keunggulan LASSO dibandingkan seleksi maju / eliminasi mundur dalam hal kesalahan prediksi validasi silang model
Saya mendapatkan tiga model tereduksi dari model full asli yang menggunakan seleksi ke depan eliminasi mundur Teknik hukuman L1 (LASSO) Untuk model yang diperoleh dengan menggunakan seleksi maju / eliminasi mundur, saya memperoleh estimasi kesalahan prediksi prediksi yang digunakan CVlmdalam paket yang DAAGtersedia di R. Untuk model yang dipilih melalui …

1
Apa perbedaan mendasar antara kedua model regresi ini?
Misalkan saya memiliki tanggapan bivariat dengan korelasi signifikan. Saya mencoba membandingkan dua cara untuk memodelkan hasil ini. Salah satu caranya adalah dengan memodelkan perbedaan antara dua hasil: Cara lain adalah dengan menggunakan atau untuk memodelkannya: ( y i j = β 0 + waktu + X ′ β )(yi2−yi1=β0+X′β)(yi2−yi1=β0+X′β)(y_{i2}-y_{i1}=\beta_0+X'\beta)glsgee(yij=β0+time+X′β)(yij=β0+time+X′β)(y_{ij}=\beta_0+\text{time}+X'\beta) Berikut …


1
Membandingkan distribusi kinerja generalisasi
Katakanlah saya memiliki dua metode pembelajaran untuk masalah klasifikasi , dan , dan bahwa saya memperkirakan kinerja generalisasi mereka dengan sesuatu seperti validasi silang berulang atau bootstrap. Dari proses ini saya mendapatkan distribusi skor dan untuk setiap metode di seluruh pengulangan ini (misalnya distribusi nilai AUC ROC untuk setiap model).AAABBB …

1
Bayes faktor dengan prior yang tidak tepat
Saya punya pertanyaan tentang perbandingan model menggunakan faktor Bayes. Dalam banyak kasus, ahli statistik tertarik untuk menggunakan pendekatan Bayesian dengan prior yang tidak tepat (misalnya beberapa prior Jeffreys dan prior reference). Pertanyaan saya adalah, dalam kasus-kasus di mana distribusi posterior parameter model didefinisikan dengan baik, apakah valid untuk membandingkan model …


Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.