Apa itu cek prediksi posterior dan apa yang membuatnya berguna?

Saya mengerti apa distribusi prediktif posterior , dan saya telah membaca tentang cek prediktif posterior , meskipun belum jelas bagi saya apa yang dilakukannya.

Apa sebenarnya pemeriksaan prediktif posterior?
Mengapa beberapa penulis mengatakan bahwa menjalankan pemeriksaan prediktif posterior adalah "menggunakan data dua kali" dan tidak boleh disalahgunakan? (atau bahkan itu bukan Bayesian)? (mis. lihat ini atau ini )
Untuk apa pemeriksaan ini bermanfaat? Bisakah itu benar-benar digunakan untuk pemilihan model? (mis. apakah itu menjadi faktor dalam kebugaran, dan kompleksitas model?)

bayesian model-selection posterior

— Amelio Vazquez-Reina
sumber

Pemeriksaan prediktif posterior adalah, dengan kata sederhana, "mensimulasikan data yang direplikasi di bawah model yang pas dan kemudian membandingkan ini dengan data yang diamati" ( Gelman dan Hill, 2007, hal. 158 ). Jadi, Anda menggunakan prediksi posterior untuk "mencari perbedaan sistematis antara data nyata dan simulasi" ( Gelman et al. 2004, hal. 169 ).

Argumen tentang "menggunakan data dua kali" adalah bahwa Anda menggunakan data Anda untuk memperkirakan model dan kemudian, untuk memeriksa apakah model cocok dengan data, sementara umumnya itu adalah ide yang buruk dan akan lebih baik untuk memvalidasi model Anda pada data eksternal , yang tidak digunakan untuk estimasi.

Pemeriksaan prediktif posterior sangat membantu dalam menilai apakah model Anda memberi Anda prediksi "valid" tentang kenyataan - apakah cocok dengan data yang diamati atau tidak. Ini adalah fase yang membantu dalam membangun dan memeriksa model. Itu tidak memberi Anda jawaban yang pasti tentang apakah model Anda "ok" atau jika "lebih baik" dari model lain, namun, ini dapat membantu Anda memeriksa apakah model Anda masuk akal.

Ini dijelaskan dengan baik dalam sketsa LaplacesDemon Bayesian Inference :

$y^\text{rep}$ $y$

Pemeriksaan prediktif posterior (melalui distribusi prediktif) melibatkan penggunaan ganda data, yang melanggar prinsip kemungkinan. Namun, argumen telah dibuat dalam mendukung pemeriksaan prediktif posterior, asalkan penggunaan terbatas pada ukuran perbedaan untuk mempelajari kecukupan model, bukan untuk perbandingan model dan inferensi (Meng 1994).

$y^\text{rep}$ $y$ $y$ $y^\text{rep}$

— Tim
sumber

Mengenai kesampingkan Anda bahwa PPC mungkin bukan Bayesian, perhatikan bahwa Gelman banyak membahas apa sebenarnya analisis data Bayesian / Bayesian adalah Gelman dan Shalizi

— N Brouwer

Gelman & Shalizi membahas apa analisis data Bayesian menurut mereka sudut pandang. Ada banyak sudut pandang berbeda di luar sana, semuanya termotivasi dengan baik - dari Jeffreys ke Savage, dari de Finetti ke Gaifman, Scott & Krauss & Hailperin , belum lagi pandangan yang semakin berbeda, seperti Dempster-Shafer's .

— pglpm