Apakah BIC mencoba menemukan model yang benar?


17

Pertanyaan ini adalah tindak lanjut atau upaya untuk menjernihkan kemungkinan kebingungan mengenai topik yang saya dan banyak orang lain temukan agak sulit, mengenai perbedaan antara AIC dan BIC. Dalam jawaban yang sangat bagus oleh @Dave Kellen tentang topik ini ( /stats//a/767/30589 ) kita membaca:

Pertanyaan Anda menyiratkan bahwa AIC dan BIC mencoba menjawab pertanyaan yang sama, yang tidak benar. AIC mencoba memilih model yang paling tepat menggambarkan realitas dimensi tinggi yang tidak diketahui. Ini berarti bahwa kenyataan tidak pernah ada dalam model kandidat yang sedang dipertimbangkan. Sebaliknya, BIC mencoba menemukan model TRUE di antara sekumpulan kandidat. Saya merasa agak aneh dengan asumsi bahwa realitas dipakai dalam salah satu model yang dibangun oleh para peneliti di sepanjang jalan. Ini adalah masalah nyata bagi BIC.

Dalam komentar di bawah ini, oleh @ gui11aume, kita membaca:

(-1) Penjelasan bagus, tapi saya ingin menantang pernyataan. @Dave Kellen Bisakah Anda memberikan referensi ke mana gagasan bahwa model TRUE harus ditetapkan untuk BIC? Saya ingin menyelidiki hal ini, karena dalam buku ini penulis memberikan bukti yang meyakinkan bahwa ini bukan masalahnya. - gui11aume 27 Mei '12 pada 21:47

Tampaknya pernyataan ini berasal dari Schwarz sendiri (1978), meskipun pernyataan itu tidak perlu: Oleh penulis yang sama (seperti tautan @ gui11aume to), kami membaca dari artikel mereka "Inferensi multimodel: Memahami AIC dan BIC dalam pemilihan Model" ( Burnham dan Anderson, 2004):

Apakah derivasi BIC mengasumsikan keberadaan model yang benar, atau, lebih sempitnya, apakah model yang sebenarnya diasumsikan berada dalam model yang ditetapkan saat menggunakan BIC? (Derivasi Schwarz menentukan kondisi ini.) ... Jawabannya ... tidak. Yaitu, BIC (sebagai dasar untuk perkiraan ke integral Bayesian tertentu) dapat diturunkan tanpa mengasumsikan bahwa model yang mendasari derivasi adalah benar (lihat, misalnya Cavanaugh dan Neath 1999; Burnham dan Anderson 2002: 293-5). Tentu saja, dalam menerapkan BIC, set model tidak perlu mengandung model sejati (tidak ada) yang mewakili realitas penuh. Selain itu, konvergensi dalam probabilitas model yang dipilih BIC ke model targbet (di bawah idealisasi sampel iid) tidak secara logis berarti bahwa model target harus menjadi distribusi penghasil data yang benar).

Jadi, saya pikir perlu diskusi atau klarifikasi (jika lebih banyak diperlukan) tentang hal ini. Saat ini, yang kami miliki adalah komentar dari @ gui11aume (terima kasih!) Di bawah jawaban yang sangat tinggi mengenai perbedaan antara AIC dan BIC.


1
Untuk memfokuskan pertanyaan dengan lebih baik, AIC mungkin dapat dihapus dari judul karena, jika saya mengerti dengan benar, pertanyaan ini adalah tentang apakah model yang sebenarnya perlu dalam kandidat yang ditetapkan ketika menggunakan BIC.
Juho Kokkala

@JuhoKokkala: Saya setuju.
Erosennin

4
Bagi saya intinya adalah bahwa dalam sebagian besar aplikasi praktis, BIC menghasilkan underfitting dan AIC menilai dengan lebih tepat kemungkinan kinerja model pada data baru yang tidak ada. Tetapi apakah Anda menggunakan AIC atau BIC jika Anda memilih di antara, katakanlah, 3 model / set fitur yang bersaing, model yang dihasilkan dapat sesuai. AIC dan BIC berfungsi paling baik ketika jumlah model potensial rendah atau model dihubungkan oleh sejumlah kecil parameter (misalnya, penalti).
Frank Harrell

Terima kasih @Erosennin untuk menggali referensi. Saya sekarang mengerti dari mana ide bahwa model TRUE harus dimasukkan berasal.
gui11aume

@ Frankharrell: Bisakah Anda menjelaskan apa yang Anda maksud dengan "aplikasi praktis"? Jika saya memahami Burnham dan Anderson dengan benar, sepertinya BIC akan menghasilkan kekurangan ketika data langka. Ketika kita memiliki banyak data, BIC akan benar-benar memilih / mencari model quasi-true yang lebih kompleks daripada AIC. AIC dan BIC memiliki "model target" yang berbeda. Saya akan senang menjelaskan apa yang Anda katakan, jika hanya untuk menunjukkan saya pada beberapa artikel / buku.
Erosennin

Jawaban:


11

p(M1|y)p(M2|y)>1ASIC(M1)<SIC(M2)
Ap(Mj|y)jy

IC(k)=2Tl(θ^;y)+kg(T)
l(θ^;y)θ^kT
g(T)0as
Tg(T)as
gAIC(T)=2T,gSIC(T)=lnTT

Elliott, G. dan A. Timmermann (2016, April). Peramalan Ekonomi. Princeton University Press.

Schwarz, Gideon. "Memperkirakan dimensi model." Catatan statistik 6.2 (1978): 461-464.

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.