Pertanyaan yang diberi tag «model-selection»

Pemilihan model adalah masalah dalam menilai model mana dari beberapa set yang berkinerja terbaik. Metode populer termasukR2, Kriteria AIC dan BIC, set uji, dan validasi silang. Hingga taraf tertentu, pemilihan fitur adalah subproblem dari pemilihan model.


6
Bandingkan R-kuadrat dari dua model Hutan Acak yang berbeda
Saya menggunakan paket randomForest dalam R untuk mengembangkan model hutan acak untuk mencoba menjelaskan hasil yang berkelanjutan dalam dataset "lebar" dengan lebih banyak prediktor daripada sampel. Secara khusus, saya memasang satu model RF yang memungkinkan prosedur untuk memilih dari serangkaian ~ 75 variabel prediktor yang menurut saya penting. Saya menguji …

2
Apakah ada model yang sesuai statistik (seperti AIC atau BIC) yang dapat digunakan untuk absolut, bukan hanya perbandingan relatif?
Saya tidak begitu terbiasa dengan literatur ini, jadi tolong maafkan saya jika ini adalah pertanyaan yang jelas. Karena AIC dan BIC bergantung pada memaksimalkan kemungkinan, tampaknya mereka hanya dapat digunakan untuk membuat perbandingan relatif antara satu set model yang mencoba menyesuaikan dengan set data yang diberikan. Menurut pemahaman saya, tidak …

3
Model campuran linier umum: pemilihan model
Pertanyaan / topik ini muncul dalam diskusi dengan seorang kolega dan saya mencari beberapa pendapat tentang ini: Saya memodelkan beberapa data menggunakan regresi logistik efek acak, lebih tepatnya regresi logistik intersep acak. Untuk efek tetap, saya memiliki 9 variabel yang menarik dan dipertimbangkan. Saya ingin melakukan semacam pemilihan model untuk …

2
Menggunakan LASSO untuk pemilihan variabel, kemudian menggunakan Logit
Saya tahu ini akan memperburuk kesimpulan statistik, tetapi saya benar-benar hanya peduli dengan sedekat mungkin dengan model yang akurat. Saya memiliki variabel hasil dikotomis, dengan seperangkat besar prediktor dikotomis. Saya pikir saya ingin mencoba menggunakan LASSO untuk memilih variabel mana yang harus saya sertakan dalam model saya, kemudian memasukkan variabel-variabel …

3
Pemilihan model Bayesian dan interval yang kredibel
Saya memiliki dataset dengan tiga variabel, di mana semua variabel kuantitatif. Sebut saja yyy , x1x1x_1 dan x2x2x_2 . Saya menyesuaikan model regresi dalam perspektif Bayesian via MCMC denganrjags Saya melakukan analisis eksplorasi dan sebar y×x2y×x2y\times x_2 menunjukkan bahwa istilah kuadrat harus digunakan. Lalu saya memasang dua model (1) y=β0+β1∗x1+β2∗x2y=β0+β1∗x1+β2∗x2y=\beta_0+\beta_1*x_1+\beta_2*x_2 …

1
Model pembelajaran dalam mana yang dapat mengklasifikasikan kategori yang tidak eksklusif satu sama lain
Contoh: Saya memiliki kalimat dalam deskripsi pekerjaan: "Java senior engineer in UK". Saya ingin menggunakan model pembelajaran yang mendalam untuk memperkirakannya sebagai 2 kategori: English dan IT jobs. Jika saya menggunakan model klasifikasi tradisional, hanya dapat memprediksi 1 label dengan softmaxfungsi di lapisan terakhir. Dengan demikian, saya dapat menggunakan 2 …
9 machine-learning  deep-learning  natural-language  tensorflow  sampling  distance  non-independent  application  regression  machine-learning  logistic  mixed-model  control-group  crossover  r  multivariate-analysis  ecology  procrustes-analysis  vegan  regression  hypothesis-testing  interpretation  chi-squared  bootstrap  r  bioinformatics  bayesian  exponential  beta-distribution  bernoulli-distribution  conjugate-prior  distributions  bayesian  prior  beta-distribution  covariance  naive-bayes  smoothing  laplace-smoothing  distributions  data-visualization  regression  probit  penalized  estimation  unbiased-estimator  fisher-information  unbalanced-classes  bayesian  model-selection  aic  multiple-regression  cross-validation  regression-coefficients  nonlinear-regression  standardization  naive-bayes  trend  machine-learning  clustering  unsupervised-learning  wilcoxon-mann-whitney  z-score  econometrics  generalized-moments  method-of-moments  machine-learning  conv-neural-network  image-processing  ocr  machine-learning  neural-networks  conv-neural-network  tensorflow  r  logistic  scoring-rules  probability  self-study  pdf  cdf  classification  svm  resampling  forecasting  rms  volatility-forecasting  diebold-mariano  neural-networks  prediction-interval  uncertainty 

2
Mengapa kriteria informasi (tidak disesuaikan
Dalam model deret waktu, seperti ARMA-GARCH, untuk memilih jeda atau urutan model kriteria informasi yang berbeda, seperti AIC, BIC, SIC, dll. Pertanyaan saya sangat sederhana, mengapa kami tidak menggunakan disesuaikan R2R2R^2untuk memilih model yang sesuai? Kita bisa pilih model yang menyebabkan nilai yang lebih tinggi dari adjusted R2R2R^2 . Karena …

4
Interpretasi nilai AIC
Nilai khas AIC yang saya lihat untuk model logistik adalah ribuan, setidaknya ratusan. misalnya pada http://www.r-bloggers.com/how-to-perform-a-logistic-regress-in-r/ AIC adalah 727,39 Meskipun selalu dikatakan bahwa AIC harus digunakan hanya untuk membandingkan model, saya ingin memahami apa arti nilai AIC tertentu. Sesuai rumus, A IC= - 2 log( L ) + 2 KSEBUAHsayaC=-2catatan⁡(L.)+2KAIC= …

1
Pemilihan model asli (?) Dengan k-fold CV
Ketika menggunakan k-fold CV untuk memilih di antara model regresi, saya biasanya menghitung kesalahan CV secara terpisah untuk masing-masing model, bersama dengan kesalahan standar SE, dan saya memilih model paling sederhana dalam 1 SE dari model dengan kesalahan CV terendah (1 aturan kesalahan standar, lihat misalnya di sini ). Namun, …

1
Kapan aturan penilaian yang tepat merupakan estimasi generalisasi yang lebih baik dalam pengaturan klasifikasi?
Pendekatan khas untuk memecahkan masalah klasifikasi adalah mengidentifikasi kelas model kandidat, dan kemudian melakukan pemilihan model menggunakan beberapa prosedur seperti validasi silang. Biasanya seseorang memilih model dengan akurasi tertinggi, atau beberapa fungsi terkait yang menyandikan informasi spesifik masalah, seperti .FβFβ\text{F}_\beta Dengan asumsi tujuan akhir adalah untuk menghasilkan classifier yang akurat …

1
Kesetaraan AIC dan nilai-p dalam pemilihan model
Dalam komentar untuk jawaban pertanyaan ini , dinyatakan bahwa menggunakan AIC dalam pemilihan model setara dengan menggunakan p-value 0,154. Saya mencobanya di R, di mana saya menggunakan algoritma seleksi subset "terbelakang" untuk membuang variabel dari spesifikasi lengkap. Pertama, dengan secara berurutan membuang variabel dengan nilai-p tertinggi dan berhenti ketika semua …

2
Kernel SVM mana yang digunakan untuk masalah klasifikasi biner?
Saya seorang pemula ketika datang untuk mendukung mesin vektor. Apakah ada beberapa pedoman yang mengatakan kernel mana (mis. Linear, polinomial) paling cocok untuk masalah tertentu? Dalam kasus saya, saya harus mengklasifikasikan halaman web menurut apakah mereka mengandung beberapa informasi spesifik atau tidak, yaitu saya memiliki masalah klasifikasi biner. Dapatkah Anda …

2
Masalah dalam menghitung, menafsirkan regsubsets, dan pertanyaan umum tentang prosedur pemilihan model
Saya ingin memilih model menggunakan regsubsets(). Saya memiliki kerangka data yang disebut olympiadaten (data diunggah: http://www.sendspace.com/file/8e27d0 ). Saya pertama-tama melampirkan kerangka data ini dan kemudian mulai menganalisis, kode saya adalah: attach(olympiadaten) library(leaps) a<-regsubsets(Gesamt ~ CommunistSocialist + CountrySize + GNI + Lifeexp + Schoolyears + ExpMilitary + Mortality + PopPoverty + …


Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.