Statistik dan Big Data model-selection

3

Kapan tepat untuk memilih model dengan meminimalkan AIC?

Sudah mapan, setidaknya di antara ahli statistik dari beberapa kaliber lebih tinggi, bahwa model dengan nilai-nilai statistik AIC dalam batas tertentu dari nilai minimum harus dianggap sesuai dengan model meminimalkan statistik AIC. Sebagai contoh, dalam [1, hal.221] kita temukan Maka model dengan GCV kecil atau AIC akan dianggap yang terbaik. …

12 time-series model-selection aic

2

Bagaimana saya harus menangani variabel kategori dengan beberapa level ketika melakukan eliminasi mundur?

Saya sedang melakukan model eliminasi mundur berbasis AIC sederhana di mana beberapa variabel adalah variabel kategori dengan beberapa level. Variabel-variabel ini dimodelkan sebagai seperangkat variabel dummy. Ketika melakukan eliminasi mundur, haruskah saya menghapus semua level variabel secara bersamaan? Atau haruskah saya memperlakukan setiap variabel dummy secara terpisah? Dan mengapa? Sebagai …

12 model-selection

1

Pemilihan model Bayesian di PyMC3

Saya menggunakan PyMC3 untuk menjalankan model Bayesian pada data saya. Saya baru untuk pemodelan Bayesian tetapi menurut beberapa posting blog , Wikipedia dan QA dari situs ini, tampaknya menjadi pendekatan yang valid untuk menggunakan faktor Bayes dan kriteria BIC untuk dapat memilih model apa yang paling mewakili data saya (yang …

11 bayesian model-selection pymc

1

Bagaimana memilih yang paling cocok tanpa data yang terlalu pas? Memodelkan distribusi bimodal dengan fungsi normal N, dll

Saya memiliki distribusi nilai bimodal yang jelas, yang menurut saya cocok. Data dapat cocok dengan 2 fungsi normal (bimodal) atau dengan 3 fungsi normal. Selain itu, ada alasan fisik yang masuk akal untuk menyesuaikan data dengan 3. Semakin banyak parameter yang diperkenalkan, semakin sempurna kesesuaiannya, karena dengan konstanta yang cukup, …

11 distributions normal-distribution model-selection overfitting

1

Pemilihan model dalam pembelajaran offline vs. online

Saya telah mencoba untuk belajar lebih banyak tentang pembelajaran online akhir-akhir ini (ini benar-benar menarik!), Dan satu tema yang belum saya pahami dengan baik adalah bagaimana memikirkan pemilihan model dalam konteks offline versus online. Secara khusus, misalkan kita melatih classifier sebuah offline, berdasarkan beberapa data fixed set . Kami memperkirakan …

11 machine-learning model-selection online

1

Apa yang saya lakukan ketika nilai AIC rendah dan kira-kira sama?

Chris Chatfield, yang banyak buku dan makalahnya yang berkualitas, saya senang membaca, dalam (1) memberikan saran berikut: Sebagai contoh, pilihan antara model deret waktu ARIMA dengan nilai AIC yang rendah dan kira-kira sama mungkin harus dibuat, bukan yang memberikan AIC minimum, tetapi yang memberikan perkiraan terbaik dari data tahun terakhir. …

11 forecasting model-selection arima aic

5

Apa yang harus dilakukan dengan variabel collinear

Penafian: Ini untuk proyek pekerjaan rumah. Saya mencoba untuk datang dengan model terbaik untuk harga berlian, tergantung pada beberapa variabel dan saya tampaknya memiliki model yang cukup bagus sejauh ini. Namun saya telah mengalami dua variabel yang jelas collinear: >with(diamonds, cor(data.frame(Table, Depth, Carat.Weight))) Table Depth Carat.Weight Table 1.00000000 -0.41035485 0.05237998 …

11 regression correlation self-study model-selection multicollinearity

1

Pemilihan model ABC

Telah ditunjukkan bahwa pilihan model ABC menggunakan faktor Bayes tidak direkomendasikan karena adanya kesalahan yang berasal dari penggunaan statistik ringkasan. Kesimpulan dalam makalah ini bergantung pada studi tentang perilaku metode populer untuk mendekati faktor Bayes (Algoritma 2). Diketahui bahwa faktor Bayes bukan satu-satunya cara untuk melakukan pemilihan model. Ada fitur …

11 bayesian model-selection prediction abc

2

Uji rasio kemungkinan log umum untuk model non-bersarang

Saya mengerti bahwa jika saya memiliki dua model A dan B dan A bersarang di B maka, diberikan beberapa data, saya dapat menyesuaikan parameter A dan B menggunakan MLE dan menerapkan tes rasio kemungkinan log umum. Secara khusus, distribusi uji harus dengan n derajat kebebasan di mana n adalah perbedaan …

10 maximum-likelihood model-selection likelihood-ratio

2

Keunggulan LASSO dibandingkan seleksi maju / eliminasi mundur dalam hal kesalahan prediksi validasi silang model

Saya mendapatkan tiga model tereduksi dari model full asli yang menggunakan seleksi ke depan eliminasi mundur Teknik hukuman L1 (LASSO) Untuk model yang diperoleh dengan menggunakan seleksi maju / eliminasi mundur, saya memperoleh estimasi kesalahan prediksi prediksi yang digunakan CVlmdalam paket yang DAAGtersedia di R. Untuk model yang dipilih melalui …

10 cross-validation model-selection lasso stepwise-regression

1

Apa perbedaan mendasar antara kedua model regresi ini?

Misalkan saya memiliki tanggapan bivariat dengan korelasi signifikan. Saya mencoba membandingkan dua cara untuk memodelkan hasil ini. Salah satu caranya adalah dengan memodelkan perbedaan antara dua hasil: Cara lain adalah dengan menggunakan atau untuk memodelkannya: ( y i j = β 0 + waktu + X ′ β )(yi2−yi1=β0+X′β)(yi2−yi1=β0+X′β)(y_{i2}-y_{i1}=\beta_0+X'\beta)glsgee(yij=β0+time+X′β)(yij=β0+time+X′β)(y_{ij}=\beta_0+\text{time}+X'\beta) Berikut …

10 r regression model-selection

3

Membandingkan model regresi logistik biner bersarang ketika

Untuk mengajukan pertanyaan saya dengan lebih baik, saya telah menyediakan beberapa output dari model 16 variabel ( fit) dan 17 model variabel ( fit2) di bawah ini (semua variabel prediktor dalam model ini kontinu, di mana satu-satunya perbedaan antara model ini adalah yang fittidak mengandung variabel 17 (var17)): fit Model …

10 r regression logistic model-selection large-data

1

Membandingkan distribusi kinerja generalisasi

Katakanlah saya memiliki dua metode pembelajaran untuk masalah klasifikasi , dan , dan bahwa saya memperkirakan kinerja generalisasi mereka dengan sesuatu seperti validasi silang berulang atau bootstrap. Dari proses ini saya mendapatkan distribusi skor dan untuk setiap metode di seluruh pengulangan ini (misalnya distribusi nilai AUC ROC untuk setiap model).AAABBB …

10 cross-validation model-selection

1

Bayes faktor dengan prior yang tidak tepat

Saya punya pertanyaan tentang perbandingan model menggunakan faktor Bayes. Dalam banyak kasus, ahli statistik tertarik untuk menggunakan pendekatan Bayesian dengan prior yang tidak tepat (misalnya beberapa prior Jeffreys dan prior reference). Pertanyaan saya adalah, dalam kasus-kasus di mana distribusi posterior parameter model didefinisikan dengan baik, apakah valid untuk membandingkan model …

10 bayesian model-selection prior

1

Pertanyaan tentang menentukan model campuran linier dalam R untuk data tindakan berulang dengan struktur bersarang tambahan

Struktur data > str(data) 'data.frame': 6138 obs. of 10 variables: $ RT : int 484 391 422 516 563 531 406 500 516 578 ... $ ASCORE : num 5.1 4 3.8 2.6 2.7 6.5 4.9 2.9 2.6 7.2 ... $ HSCORE : num 6 2.1 7.9 1 6.9 8.9 …

10 r mixed-model repeated-measures model-selection lme4-nlme

Pertanyaan yang diberi tag «model-selection»