Saya akan menyarankan bahwa ini adalah masalah dengan bagaimana hasilnya dilaporkan. Bukan untuk "mengalahkan drum Bayesian" tetapi mendekati ketidakpastian model dari perspektif Bayesian sebagai masalah inferensi akan sangat membantu di sini. Dan itu tidak harus menjadi perubahan besar juga. Jika laporan itu hanya berisi kemungkinan bahwa model itu benar, ini akan sangat membantu. Ini adalah jumlah yang mudah untuk diperkirakan menggunakan BIC. Hubungi BIC untuk model mth . Maka probabilitas bahwa model m adalah model "benar", mengingat bahwa model M cocok (dan bahwa salah satu model itu benar) diberikan oleh:BICmM
P(model m is true|one of the M models is true)≈wmexp(−12BICm)∑Mj=1wjexp(−12BICj)
=11+∑Mj≠mwjwmexp(−12(BICj−BICm))
wjwj=1
BICfinal<BICjpd
M≥1+p+(p−1)+⋯+(p−d+1)=1+p(p−1)−(p−d)(p−d−1)2
M≥1+p+(p−1)+⋯+(d+1)=1+p(p−1)−d(d−1)2
MBICjλBICm=BICj−λ , maka probabilitas menjadi:
11+(M−1)exp(−λ2)
Jadi apa artinya ini kecuali itu λ besar atau M.kecil, probabilitasnya juga kecil. Dari perspektif "over-fitting", ini akan terjadi ketika BIC untuk model yang lebih besar tidak jauh lebih besar dari BIC untuk model yang lebih kecil - istilah yang tidak dapat diabaikan muncul dalam penyebut. Memasukkan formula seleksi mundur untukM. kita mendapatkan:
11 + p ( p - 1 ) - d( d- 1 )2exp( - λ2)
Sekarang anggaplah kita membalikkan masalahnya. mengatakanp = 50 dan seleksi mundur memberi d=20 variables, what would λ have to be to make the probability of the model greater than some value P0? we have
λ>−2log(2(1−P0)P0[p(p−1)−d(d−1)])
Setting P0=0.9 we get λ>18.28 - so BIC of the winning model has to win by a lot for the model to be certain.