Apa pembenaran keputusan-teoretis untuk prosedur interval Bayesian yang kredibel?

(Untuk mengetahui mengapa saya menulis ini, periksa komentar di bawah jawaban saya untuk pertanyaan ini .)

Tipe III kesalahan dan teori keputusan statistik

Memberikan jawaban yang benar untuk pertanyaan yang salah kadang-kadang disebut kesalahan Tipe III. Teori keputusan statistik adalah formalisasi pengambilan keputusan di bawah ketidakpastian; ini menyediakan kerangka kerja konseptual yang dapat membantu seseorang menghindari kesalahan tipe III. Elemen kunci dari kerangka kerja ini disebut fungsi kerugian . Dibutuhkan dua argumen: yang pertama adalah (bagian yang relevan dari) keadaan sebenarnya dari dunia (misalnya, dalam masalah estimasi parameter, nilai parameter sebenarnya ); yang kedua adalah elemen dalam himpunan tindakan yang mungkin (misalnya, dalam masalah estimasi parameter, estimasi $\theta$ $\hat{\theta})$ . Outputnya memodelkan kerugian yang terkait dengan setiap tindakan yang mungkin terjadi sehubungan dengan setiap kemungkinan kondisi dunia yang sebenarnya. Misalnya, dalam masalah estimasi parameter, beberapa fungsi kerugian yang terkenal adalah:

hilangnya kesalahan absolut $L(\theta, \hat{\theta}) = |\theta - \hat{\theta}|$
kerugian kesalahan kuadrat $L(\theta, \hat{\theta}) = (\theta - \hat{\theta})^2$
Kehilangan LINEX Hal Varian $L(\theta, \hat{\theta}; k) = \exp(k(\theta - \hat{\theta})) - k(\theta - \hat{\theta}) - 1,\text{ } k \ne0$

Meneliti jawaban untuk menemukan pertanyaan

Ada kasus yang orang mungkin mencoba untuk membuat kesalahan tipe III dapat dihindari dengan berfokus pada merumuskan fungsi kerugian yang benar dan melanjutkan melalui sisa pendekatan teoretik-keputusan (tidak dirinci di sini). Itu bukan uraian singkat saya - lagipula, ahli statistik dilengkapi dengan banyak teknik dan metode yang bekerja dengan baik meskipun mereka tidak berasal dari pendekatan semacam itu. Tetapi hasil akhirnya, menurut saya, adalah bahwa sebagian besar ahli statistik tidak tahu dan tidak peduli dengan teori keputusan statistik, dan saya pikir mereka kehilangan. Bagi para ahli statistik, saya berpendapat bahwa alasan mereka mungkin menganggap teori keputusan statistik berharga dalam hal menghindari kesalahan Tipe III adalah karena memberikan kerangka kerja untuk menanyakan prosedur analisis data yang diajukan:fungsi kerugian apa (jika ada) yang ditangani oleh prosedur secara optimal? Yaitu, dalam situasi pengambilan keputusan apa, tepatnya, apakah itu memberikan jawaban terbaik?

Kerugian yang diperkirakan posterior

Dari perspektif Bayesian, fungsi kerugian adalah semua yang kita butuhkan. Kami dapat cukup banyak melewatkan sisa teori keputusan - hampir menurut definisi, hal terbaik untuk dilakukan adalah untuk meminimalkan posterior diharapkan kerugian, yaitu, menemukan tindakan yang meminimalkan . $a$ $\tilde{L}(a) = \int_{\Theta}L(\theta, a)p(\theta|D)d\theta$

(Dan untuk perspektif non-Bayesian? Nah, itu adalah teorema teori keputusan yang sering terjadi - khususnya, Teorema Kelas Lengkap Wald - bahwa tindakan optimal akan selalu meminimalkan kerugian posterior Bayesian yang diharapkan sehubungan dengan beberapa (mungkin tidak tepat)) Kesulitan dengan hasil ini adalah bahwa itu adalah teorema keberadaan yang tidak memberikan pedoman yang sebelum digunakan.Tetapi itu berbuah membatasi kelas prosedur yang kita dapat "membalikkan" untuk mencari tahu persis pertanyaan mana yang kita Menjawab Secara khusus, langkah pertama dalam membalikkan prosedur non-Bayesian adalah untuk mencari tahu mana (jika ada) prosedur Bayesian yang direplikasi atau didekati.)

Hei Cyan, Anda tahu ini adalah situs tanya jawab, kan?

Yang membawa saya - akhirnya - ke pertanyaan statistik. Dalam statistik Bayesian, ketika memberikan estimasi interval untuk parameter univariat, dua prosedur interval kredibel yang umum adalah interval kredibel berbasis kuantil dan interval kredibilitas posterior kepadatan tertinggi. Apa fungsi kerugian di balik prosedur ini?

bayesian credible-interval decision-theory

— Cyan
sumber

Sangat bagus. Tetapi apakah mereka satu - satunya fungsi kerugian yang membenarkan prosedur ini?

— Tamu

@Cyan >> Terima kasih telah bertanya dan menjawab pertanyaan untuk saya :) Saya akan membaca semua ini dan membenarkan bila memungkinkan.

— Stéphane Laurent

Kutipan menarik dari teori keputusan statistik Berger dan analisis Bayesian : "kami tidak melihat perangkat yang kredibel memiliki peran teoretik keputusan yang jelas, dan karenanya curiga dengan pendekatan 'optimal' untuk pemilihan perangkat yang kredibel"

— Simon Byrne

@Simon Byrne >> 1985 sudah lama; Aku ingin tahu apakah dia masih berpikir seperti itu.

— Cyan

@Cyan: Saya tidak tahu, tetapi teori keputusan adalah satu bagian dari statistik Bayesian yang tidak banyak berubah selama 27 tahun terakhir (ada beberapa hasil yang menarik, tetapi buku Berger masih menjadi referensi standar), terutama bila dibandingkan dengan hasil minimal popularitas dalam statistik frequentist.

— Simon Byrne

Jawaban:

Dalam estimasi interval univariat, himpunan tindakan yang mungkin adalah himpunan pasangan berurutan yang menentukan titik akhir interval. Biarkan elemen set tersebut diwakili oleh . $(a, b),\text{ } a \le b$

Interval kepadatan posterior tertinggi

Biarkan kerapatan posterior menjadi . Interval kepadatan posterior tertinggi sesuai dengan fungsi kehilangan yang menghukum suatu interval yang gagal mengandung nilai sebenarnya dan juga menghukum interval dalam proporsi dengan panjangnya: $f(\theta)$

$L_{HPD}(\theta, (a, b); k) = I(\theta \notin [a, b]) + k(b – a), \text{} 0 < k \le max_{\theta} f(\theta)$ ,

di mana adalah fungsi indikator . Ini memberikan kerugian posterior yang diharapkan $I(\cdot)$

$\tilde{L}_{HPD}((a, b); k) = 1 - \Pr(a \le \theta \le b|D) + k(b – a)$ .

Mengatur menghasilkan kondisi yang diperlukan untuk suatu optimal lokal di bagian dalam ruang parameter: - persis aturan untuk interval HPD, seperti yang diharapkan. $\frac{\partial}{\partial a}\tilde{L}_{HPD} = \frac{\partial}{\partial b}\tilde{L}_{HPD} = 0$ $f(a) = f(b) = k$

Bentuk memberikan beberapa wawasan mengapa interval HPD tidak berbeda dengan transformasi monoton peningkatan dari parameter. The -space HPD selang berubah menjadi ruang berbeda dari -space HPD selang karena dua interval sesuai dengan fungsi kerugian yang berbeda: -space HPD Interval bersesuaian dengan penalti panjang yang diubah . $\tilde{L}_{HPD}((a, b); k)$ $g(\theta)$ $\theta$ $g(\theta)$ $g(\theta)$ $g(\theta)$ $k(g(b) – g(a))$

Interval kredibel berbasis kuantitas

Pertimbangkan estimasi titik dengan fungsi kerugian

$L_q(\theta, \hat{\theta};p) = p(\hat{\theta} - \theta)I(\theta < \hat{\theta}) + (1-p)(\theta - \hat{\theta})I(\theta \ge \hat{\theta}), \text{ } 0 \le p \le 1$ .

Kerugian yang diharapkan posterior adalah

$\tilde{L}_q(\hat{\theta};p)=p(\hat{\theta}-\text{E}(\theta|\theta < \hat{\theta}, D)) + (1 - p)(\text{E}(\theta | \theta \ge \hat{\theta}, D)-\hat{\theta})$ .

Pengaturan menghasilkan persamaan implisit $\frac{d}{d\hat{\theta}}\tilde{L}_q=0$

$\Pr(\theta < \hat{\theta}|D) = p$ ,

yaitu, optimal adalah % quantile dari distribusi posterior, seperti yang diharapkan. $\hat{\theta}$ $(100p)$

Jadi untuk mendapatkan estimasi interval berbasis kuantil, fungsi kerugiannya adalah

$L_{qCI}(\theta, (a,b); p_L, p_U) = L_q(\theta, a;p_L) + L_q(\theta, b;p_U)$ .

— Cyan
sumber

Cara lain untuk memotivasi ini adalah menulis ulang fungsi kerugian sebagai jumlah (tertimbang) dari lebar interval ditambah jarak, jika ada, dimana interval gagal untuk menutupi .

θ

$\theta$

— Tamu

Apakah ada cara lain untuk memikirkan interval berbasis kuantil yang tidak secara langsung mereferensikan kuantil atau panjang interval. Saya berharap untuk sesuatu seperti "interval kuantil memaksimalkan / meminimalkan rata-rata / minimum / maksimum / dll. Sesuatu-ukuran"

— Rasmus Bååth

@ RasmusBååth, Anda pada dasarnya bertanya, "kondisi apa yang diperlukan pada fungsi kehilangan untuk interval kuantil untuk menjadi solusi untuk meminimalkan kerugian yang diperkirakan posterior?" Intuisi saya, hanya dari cara matematika bekerja di arah maju, adalah bahwa ini sudah cukup. Tapi belum terbukti.

— Cyan

Jadi saya tidak yakin tentang fungsi kerugian, tetapi saya tahu prosedur yang, tergantung pada fungsi kehilangan titik , akan menghasilkan HPD atau interval kuantil. Asumsikan Anda memiliki sampel acak imbang dari posterior. 1. Pilih titik dalam dengan kerugian posterior terendah dan tambahkan titik itu ke interval Anda. 2. Lepaskan titik itu dari , karena penghilangan ini kehilangan posterior untuk sisa poin dalam sekarang dapat berubah (tergantung pada ). 3. Berbahagia jika interval Anda memiliki cakupan yang diperlukan, jika tidak ulangi dari (1). L = L0 memberikan HPD, L = L1 memberikan interval kuantil.

L

$L$

s

$s$

s

$s$

s

$s$

s

$s$

L

$L$

— Rasmus Bååth

hanya menyebutkan bahwa Bagian 5.5.3 dari Bayesian Choice mencakup derivasi berdasarkan kehilangan set yang kredibel ...

— Xi'an

Interval ukuran minimal

Salah satu pilihan yang jelas dari fungsi kehilangan untuk pemilihan interval (baik Bayesian dan frequentist) adalah menggunakan ukuran interval yang diukur dalam distribusi marjinal. Jadi, mulailah dengan properti yang diinginkan atau fungsi kerugian, dan turunkan interval yang optimal. Ini cenderung tidak dilakukan, seperti yang dicontohkan oleh pertanyaan saat ini, meskipun itu mungkin. Untuk set yang kredibel Bayesian, ini sesuai untuk meminimalkan probabilitas sebelumnya dari interval, atau untuk memaksimalkan keyakinan relatif, misalnya, sebagaimana diuraikan dalam Evans (2016). Ukuran ini juga dapat digunakan untuk memilih set kepercayaan yang sering terjadi (Schafer 2009). Kedua pendekatan tersebut saling terkait dan dapat diimplementasikan dengan cukup mudah melalui aturan keputusan yang secara istimewa memasukkan keputusan dengan informasi timbal balik yang besar (Bartels 2017).

Bartels, C., 2017. Menggunakan pengetahuan sebelumnya dalam tes yang sering dilakukan. figshare. https://doi.org/10.6084/m9.figshare.4819597.v3

Evans, M., 2016. Mengukur bukti statistik menggunakan kepercayaan relatif. Jurnal bioteknologi komputasi dan struktural, 14, hlm.91-96.

Schafer, CM dan Stark, PB, 2009. Membangun wilayah kepercayaan dengan ukuran yang diharapkan optimal. Jurnal Asosiasi Statistik Amerika, 104 (487), hlm.1080-1089.

— pengguna36160
sumber

Saya melihat Anda mengutip Evans sesuai saran Keith O'Rourke ( andrewgelman.com/2016/07/17/… ). Saya sangat suka barang-barang Evans.

— Cyan

Saya sangat senang mendapat informasi dari Keith tentang pekerjaan yang dimulai secara berbeda tetapi berakhir pada kesimpulan yang sama! Penting untuk mengutip ini.

— user36160