Apakah analisis kekuatan diperlukan dalam Statistik Bayesian?


19

Saya telah meneliti Bayesian mengambil statistik klasik belakangan ini. Setelah membaca tentang faktor Bayes saya bertanya-tanya apakah analisis daya merupakan keharusan dalam pandangan statistik ini. Alasan utama saya untuk bertanya-tanya ini adalah faktor Bayes yang tampaknya hanya rasio kemungkinan. Setelah itu seperti 25: 1 sepertinya saya bisa menyebutnya malam.

Apakah saya jauh? Adakah bacaan lain yang bisa saya lakukan untuk belajar lebih banyak? Saat ini membaca buku ini: Pengantar Bayesian Statistics , oleh WM Bolstad (Wiley-Interscience; 2nd ed., 2007).



Jawaban:


10

Kekuatan adalah tentang probabilitas jangka panjang dari p <0,05 (alpha) dalam studi masa depan. Di Bayes bukti dari studi A dimasukkan ke dalam prior untuk studi B, dll. Di telepon. Oleh karena itu, kekuatan sebagaimana didefinisikan dalam statistik frequentist tidak benar-benar ada.


12
Pandangan kekuasaan yang kurang terbatas melihatnya sebagai ekspresi kurva risiko untuk fungsi kerugian 0-1. Analisis Bayesian mengintegrasikan risiko itu di atas probabilitas sebelumnya. Namun, analisis Bayesian yang baik mempertimbangkan sensitivitas hasil mereka terhadap pilihan distribusi sebelumnya. Itu tampaknya menempatkan kita kembali ke domain analisis kekuasaan. Meskipun mungkin tidak menggunakan nama itu dan akan dihitung secara berbeda, tujuannya akan sama: yaitu, menentukan seberapa besar sampel yang akan diperoleh agar cukup yakin memenuhi tujuan penelitian.
Whuber

2
Itu poin yang sangat bagus Whuber. Namun, itu bukan satu-satunya alasan perhitungan daya dan banyak orang Bayesian akan berpendapat bahwa itu tidak perlu karena Anda tidak perlu menentukan N terlebih dahulu (kesalahan).
John

5
N

2
Saya tidak datang dengan ide, ada sejumlah makalah di mana Bayesians berpendapat bahwa Anda dapat menambahkan subjek sampai Anda memiliki bukti yang cukup kuat untuk membuat keputusan yang bertentangan dengan pengujian yang sering dilakukan di mana pengujian dan prosedur penambahan tidak bekerja. Saya bisa mencari referensi saya kira. Terutama ini muncul dalam mengusulkan bagaimana menganalisis data dalam uji klinis.
John

8
N

14

Anda dapat melakukan tes hipotesis dengan statistik Bayesian. Misalnya, Anda dapat menyimpulkan efek lebih besar dari nol jika lebih dari 95% kepadatan posterior lebih besar dari nol. Atau alternatif, Anda bisa menggunakan beberapa bentuk keputusan biner berdasarkan faktor Bayes.

Setelah Anda membuat sistem pengambilan keputusan seperti itu, dimungkinkan untuk menilai kekuatan statistik dengan mengasumsikan proses pembuatan data dan ukuran sampel yang diberikan. Anda dapat dengan mudah menilai ini dalam konteks yang diberikan menggunakan simulasi.

Yang mengatakan, pendekatan Bayesian sering lebih berfokus pada interval kredibilitas daripada estimasi titik, dan tingkat kepercayaan daripada keputusan biner. Dengan menggunakan pendekatan inferensi yang lebih berkelanjutan ini, Anda dapat menilai efek lain pada inferensi desain Anda. Khususnya, Anda mungkin ingin menilai ukuran interval kredibilitas yang diharapkan untuk proses pembuatan data dan ukuran sampel yang diberikan.


3

Masalah ini menyebabkan banyak kesalahpahaman karena orang menggunakan statistik Bayes untuk mengajukan pertanyaan yang sering. Misalnya, orang ingin menentukan apakah varian B lebih baik daripada varian A. Mereka dapat menjawab pertanyaan ini dengan statistik Bayesian dengan menentukan apakah interval kepadatan tertinggi 95% dari perbedaan antara kedua distribusi posterior (BA) lebih besar dari 0 atau a wilayah signifikansi praktis di sekitar 0. Jika Anda menggunakan statistik bayesian untuk menjawab pertanyaan yang sering, Anda masih dapat membuat kesalahan yang sering terjadi: tipe I (false positive; opps - B sebenarnya tidak lebih baik) dan tipe II (miss; gagal menyadari bahwa B benar-benar lebih baik).

Titik analisis kekuatan adalah mengurangi kesalahan tipe II (misalnya memiliki setidaknya 80% peluang untuk menemukan efek jika ada). Analisis kekuatan juga harus digunakan ketika menggunakan statistik Bayesian untuk mengajukan pertanyaan yang sering muncul seperti yang di atas.

Jika Anda tidak menggunakan analisis daya, dan kemudian Anda berulang kali mengintip data Anda saat mengumpulkannya dan kemudian berhenti hanya setelah Anda menemukan perbedaan yang signifikan, maka Anda akan membuat lebih banyak kesalahan tipe I (false alarm) daripada yang Anda harapkan - sama seperti jika Anda menggunakan statistik frequentist.

Periksa:

https://doingbayesiandataanalysis.blogspot.com/2013/11/optional-stopping-in-data-collection-p.html

http://varianceexplained.org/r/bayesian-ab-testing/

Yang perlu diperhatikan - Beberapa pendekatan Bayesian dapat mengurangi, tetapi tidak menghilangkan, kemungkinan membuat kesalahan tipe I (misalnya, prior informatif yang sesuai).


0

Kebutuhan untuk analisis kekuatan dalam uji klinis misalnya adalah untuk dapat menghitung / memperkirakan berapa banyak peserta yang direkrut untuk memiliki kesempatan menemukan efek pengobatan (dari ukuran minimum yang diberikan) jika ada. Tidak mungkin merekrut jumlah pasien yang tak terbatas, pertama karena kendala waktu dan kedua karena kendala biaya.

Jadi, bayangkan kita mengambil pendekatan Bayesian untuk uji klinis tersebut. Walaupun secara teori flat prior dimungkinkan, kepekaan terhadap prior lebih disarankan karena, sayangnya, lebih dari satu flat sebelumnya tersedia (yang aneh sekarang saya pikirkan, karena seharusnya hanya ada satu cara untuk mengekspresikan ketidakpastian yang sangat besar).

Jadi, bayangkan bahwa, lebih jauh, kami melakukan analisis sensitivitas (model dan bukan hanya yang sebelumnya juga akan diteliti di sini). Ini melibatkan simulasi dari model yang masuk akal untuk 'kebenaran'. Dalam statistik klasik / Frequentist, ada empat kandidat untuk 'kebenaran' di sini: H0, mu = 0; H1, mu! = 0 di mana diamati dengan kesalahan (seperti di dunia nyata kita), atau tanpa kesalahan (seperti di dunia nyata yang tidak dapat diamati). Dalam statistik Bayesian, ada dua kandidat untuk 'kebenaran' di sini: mu adalah variabel acak (seperti di dunia nyata yang tidak dapat diamati); mu adalah variabel acak (seperti dalam dunia nyata kita yang dapat diamati, dari sudut pandang individu yang tidak pasti).

Jadi itu benar-benar tergantung pada siapa Anda mencoba meyakinkan A) dengan percobaan dan B) oleh analisis sensitivitas. Jika bukan orang yang sama, itu akan sangat aneh.

Apa yang sebenarnya dipertanyakan adalah konsensus tentang apa kebenaran itu dan pada apa yang membuktikan bukti nyata. Landasan yang dibagikan adalah bahwa distribusi probabilitas tanda tangan dapat diamati di dunia nyata kita yang dapat diamati yang ternyata memiliki beberapa kebenaran matematika yang mendasarinya yang kebetulan terjadi secara kebetulan, atau karena desain. Saya akan berhenti di sana karena ini bukan halaman Seni, melainkan halaman Sains, atau itulah pemahaman saya.

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.