Pertanyaan yang diberi tag «model-selection»

Pemilihan model adalah masalah dalam menilai model mana dari beberapa set yang berkinerja terbaik. Metode populer termasukR2, Kriteria AIC dan BIC, set uji, dan validasi silang. Hingga taraf tertentu, pemilihan fitur adalah subproblem dari pemilihan model.

1
Bisakah Anda membandingkan nilai AIC selama model didasarkan pada dataset yang sama?
Saya melakukan beberapa peramalan dalam R menggunakan paket perkiraan Rob Hyndman . Kertas milik paket dapat ditemukan di sini . Dalam makalah, setelah menjelaskan algoritma peramalan otomatis, penulis mengimplementasikan algoritma pada set data yang sama. Namun, setelah memperkirakan model eksponensial smoothing dan ARIMA mereka membuat pernyataan yang saya tidak mengerti …

1
Istilah interaksi dan polinomial berurutan lebih tinggi
Jika saya tertarik untuk menyesuaikan interaksi dua arah antara variabel penjelas linier dan variabel penjelas lain yang memiliki hubungan kuadratik dengan variabel dependen , apakah saya harus memasukkan interaksi dengan komponen kuadratik dan interaksi dengan linier komponen dalam model? Misalnya: Pada gilirannya membangun di utas saya sebelumnya: Istilah kelengkungan dan …


1
Seleksi variabel vs Seleksi model
Jadi saya mengerti bahwa pemilihan variabel adalah bagian dari pemilihan model. Tapi apa sebenarnya yang terdiri dari pemilihan model? Apakah lebih dari yang berikut: 1) pilih distribusi untuk model Anda 2) pilih variabel penjelas,? Saya bertanya ini karena saya membaca artikel Burnham & Anderson: AIC vs BIC di mana mereka …

1
Kapan saya harus khawatir tentang paradoks Jeffreys-Lindley dalam pilihan model Bayesian?
Saya sedang mempertimbangkan ruang besar (tetapi terbatas) model kompleksitas yang berbeda yang saya jelajahi menggunakan RJMCMC . Sebelumnya pada vektor parameter untuk setiap model cukup informatif. Dalam kasus apa (jika ada) yang harus saya khawatirkan dengan paradoks Jeffreys-Lindley yang mendukung model yang lebih sederhana ketika salah satu model yang lebih …

1
Apa perbedaan antara 'pengujian hipotesis' dan 'pemilihan model'?
Dalam literatur, kedua istilah ini sering digunakan secara sinonim atau terjalin. Sekarang saya mencoba untuk menemukan perbedaan yang jelas antara kedua istilah. Dari sudut pandang saya, hipotesis biasanya dinyatakan melalui model. Jadi, bahkan jika kita menguji hipotesis nol vs alternatif, dari perspektif saya, kami melakukan pemilihan model. Bisakah seseorang memberi …

3
Bayesian vs MLE, masalah overfitting
Dalam buku PRML Bishop, ia mengatakan bahwa, overfitting adalah masalah dengan Estimasi Kemungkinan Maksimum (MLE), dan Bayesian dapat menghindarinya. Tapi saya pikir, overfitting adalah masalah lebih banyak tentang pemilihan model, bukan tentang metode yang digunakan untuk melakukan estimasi parameter. Yaitu, misalkan saya memiliki kumpulan data , yang dihasilkan melalui f …

1
Log-linked Gamma GLM vs log-linked Gaussian GLM vs log-transformed LM
Dari hasil saya, tampak bahwa GLM Gamma memenuhi sebagian besar asumsi, tetapi apakah ini merupakan peningkatan yang berharga atas LM yang ditransformasikan log? Kebanyakan literatur yang saya temukan berhubungan dengan Poisson atau Binomial GLMs. Saya menemukan artikel EVALUASI ASUMSI MODEL LINEAR UMUM MENGGUNAKAN RANDOMISASI sangat berguna, tetapi tidak memiliki plot …

1
AIC untuk model non-bersarang: normalisasi konstan
AIC didefinisikan sebagai , di mana adalah estimator kemungkinan maksimum dan adalah dimensi ruang parameter. Untuk estimasi , biasanya diabaikan faktor konstan dari kepadatan. Ini adalah faktor yang tidak bergantung pada parameter, untuk menyederhanakan kemungkinan. Di sisi lain, faktor ini sangat penting untuk perhitungan AIC, mengingat bahwa ketika membandingkan model …

4
Pemilihan model PCA menggunakan AIC (atau BIC)
Saya ingin menggunakan Akaike Information Criterion (AIC) untuk memilih jumlah faktor yang tepat untuk diekstraksi dalam PCA. Satu-satunya masalah adalah saya tidak yakin bagaimana menentukan jumlah parameter. Pertimbangkan matriks , di mana mewakili jumlah variabel dan jumlah pengamatan, sehingga . Karena matriks kovarians simetris, maka estimasi kemungkinan maksimum dapat menetapkan …

1
Perbedaan antara PROC Mixed dan lme / lmer dalam R - derajat kebebasan
Catatan: pertanyaan ini adalah repost, karena pertanyaan saya sebelumnya harus dihapus karena alasan hukum. Sambil membandingkan PROC CAMPURAN dari SAS dengan fungsi lmedari nlmepaket di R, saya menemukan beberapa perbedaan yang agak membingungkan. Lebih khusus lagi, derajat kebebasan dalam berbagai tes berbeda antara PROC MIXEDdan lme, dan saya bertanya-tanya mengapa. …
12 r  mixed-model  sas  degrees-of-freedom  pdf  unbiased-estimator  distance-functions  functional-data-analysis  hellinger  time-series  outliers  c++  relative-risk  absolute-risk  rare-events  regression  t-test  multiple-regression  survival  teaching  multiple-regression  regression  self-study  t-distribution  machine-learning  recommender-system  self-study  binomial  standard-deviation  data-visualization  r  predictive-models  pearson-r  spearman-rho  r  regression  modeling  r  categorical-data  data-visualization  ggplot2  many-categories  machine-learning  cross-validation  weka  microarray  variance  sampling  monte-carlo  regression  cross-validation  model-selection  feature-selection  elastic-net  distance-functions  information-theory  r  regression  mixed-model  random-effects-model  fixed-effects-model  dataset  data-mining 


1
Uji kesetaraan model non-bersarang
Katakanlah adalah fungsi linier dari dan dummy . Hipotesis saya adalah bahwa itu sendiri adalah seperti indeks hedonistik dari vektor variabel lainnya, . Saya memiliki dukungan untuk ini dalam dari (yaitu , , ..., ) pada . Apakah ada cara untuk menguji kesetaraan kedua model ini:x d d Z M …

2
GLM setelah pemilihan model atau regularisasi
Saya ingin mengajukan pertanyaan ini dalam dua bagian. Keduanya berurusan dengan model linier umum, tetapi yang pertama berkaitan dengan pemilihan model dan yang lainnya berkaitan dengan regularisasi. Latar Belakang: Saya menggunakan model GLM (linier, logistik, regresi gamma) untuk prediksi dan deskripsi. Ketika saya merujuk pada " hal-hal normal yang dilakukan …

1

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.