Mengapa seseorang menggunakan kepercayaan 'acak' atau interval yang kredibel?


16

Saya membaca sebuah makalah baru-baru ini yang memasukkan keacakan dalam interval kepercayaan dan kredibilitasnya, dan saya bertanya-tanya apakah ini standar (dan, jika demikian, mengapa itu merupakan hal yang masuk akal untuk dilakukan). Untuk mengatur notasi, asumsikan bahwa data kami adalah dan kami tertarik untuk membuat interval untuk parameter . Saya terbiasa dengan interval kepercayaan / kredibilitas yang dibangun dengan membangun fungsi:xXθΘ

fx:Θ{0,1}

dan membiarkan interval kita menjadi .I={θΘ:fx(θ)=1}

Ini acak dalam arti tergantung pada data, tetapi tergantung pada data itu hanya interval. Makalah ini malah mendefinisikan

gx:Θ[0,1]

dan juga kumpulan variabel acak seragam iid pada . Ini mendefinisikan interval terkait menjadi . Perhatikan bahwa ini sangat tergantung pada keacakan tambahan, di luar apa pun yang berasal dari data.{Uθ}θΘ[0,1]I={θΘ:fx(θ)Uθ}

Saya sangat ingin tahu mengapa orang melakukan ini. Saya pikir `bersantai 'gagasan interval dari fungsi seperti ke fungsi seperti masuk akal; ini adalah semacam interval kepercayaan tertimbang. Saya tidak tahu referensi untuk itu (dan akan menghargai petunjuk apa pun), tetapi tampaknya cukup alami. Namun, saya tidak bisa memikirkan alasan untuk menambahkan keacakan tambahan. g xfxgx

Setiap petunjuk literatur / alasan untuk melakukan ini akan dihargai!


5
(+1) Ini disebut prosedur acak. Mereka adalah bagian standar dari estimasi statistik dan kerangka kerja pengujian, sehingga Anda dapat mengandalkan hampir semua buku teks keras untuk memberikan penjelasan. Motivasi tambahan untuk penggunaannya dapat ditemukan dalam literatur teori permainan.
whuber

Terima kasih atas tanggapannya. Saya menyadari setelah membaca komentar ini bahwa misalnya bootstrap cocok dengan kerangka kerja ini, tetapi dalam situasi itu alasan pengacakan jelas (Anda tidak memiliki akses ke f, hanya g). Dalam kasus saya, penulis secara eksplisit menghitung , dan MAKA melihat g x . Meskipun saya memiliki banyak buku statistik, saya tidak melihat ini di mana pun ... apakah Anda memiliki teks yang disarankan? fxgx
QQQ

3
Sebenarnya, bootstrap bukan prosedur acak. Ini adalah prosedur penentuan yang perkiraan perhitungannya dilakukan dengan cara pengambilan sampel acak.
whuber

Jawaban:


4

Prosedur acak kadang-kadang digunakan dalam teori karena menyederhanakan teori. Dalam masalah statistik yang khas, itu tidak masuk akal dalam praktiknya, sementara dalam pengaturan teori permainan bisa masuk akal.

Satu-satunya alasan saya bisa melihatnya untuk menggunakannya dalam praktik, adalah jika entah bagaimana menyederhanakan perhitungan.

Secara teoritis, orang dapat berargumen bahwa itu tidak boleh digunakan, dari prinsip kecukupan : kesimpulan statistik hanya harus didasarkan pada ringkasan data yang memadai, dan pengacakan memperkenalkan ketergantungan pada acak asing yang bukan bagian dari ringkasan data yang cukup.U

UPDATE  

Untuk menjawab komentar whuber di bawah ini, yang dikutip di sini: "Mengapa prosedur acak" tidak masuk akal dalam praktik "? Seperti yang telah dicatat oleh orang lain, para peneliti sangat ingin menggunakan pengacakan dalam pembuatan data eksperimental mereka, seperti penugasan pengobatan dan kontrol secara acak. , jadi apa yang sangat berbeda (dan tidak praktis atau tidak menyenangkan) tentang menggunakan pengacakan dalam analisis data selanjutnya? "

Nah, pengacakan percobaan untuk mendapatkan data dilakukan untuk suatu tujuan, terutama untuk memutus rantai sebab akibat. Jika dan kapan itu efektif adalah diskusi lain. Apa yang bisa menjadi tujuan menggunakan pengacakan sebagai bagian dari analisis? Satu-satunya alasan yang pernah saya lihat adalah membuat teori matematika lebih lengkap! Tidak apa-apa selama itu berjalan. Dalam konteks teori permainan, ketika ada musuh yang sebenarnya, pengacakan bantuan saya untuk membingungkannya. Dalam konteks keputusan nyata (menjual, atau tidak menjual?) Keputusan harus diambil, dan jika tidak ada bukti dalam data, mungkin seseorang bisa melempar koin. Namun dalam konteks ilmiah, di mana pertanyaannya adalah apa yang bisa kita pelajaridari data, pengacakan tampaknya tidak pada tempatnya. Saya tidak bisa melihat keuntungan nyata darinya! Jika Anda tidak setuju, apakah Anda memiliki argumen yang dapat meyakinkan seorang ahli biologi atau ahli kimia? (Dan di sini saya tidak berpikir tentang simulasi sebagai bagian dari bootstrap atau MCMC.)


1
Mengapa prosedur acak "tidak masuk akal dalam praktik"? Seperti yang telah dicatat oleh orang lain, para peneliti sangat ingin menggunakan pengacakan dalam pembuatan data eksperimental mereka, seperti penetapan perlakuan dan kontrol secara acak, sehingga apa yang sangat berbeda (dan tidak praktis atau tidak menyenangkan) tentang penggunaan pengacakan dalam analisis data selanjutnya. ?
whuber

1
@ kjetil Saya pikir Anda mungkin tidak menyelesaikan pernyataan Anda tentang prinsip kecukupan, tampaknya telah terputus di tengah kalimat ("kesimpulan statistik seharusnya ...").
Silverfish

1
U

1
@whuber: Ini adalah argumen yang jelas dan berprinsip bahwa pengacakan dalam memperoleh data mungkin menguntungkan. (Ini merusak rantai sebab akibat). Apa argumen berprinsip untuk menggunakan pengacakan sebagai bagian dari analisis?
kjetil b halvorsen

1
Kjetil: Ini memungkinkan Anda untuk mencapai fungsi risiko yang diinginkan, daripada menerima fungsi risiko (seringkali dalam bentuk ukuran dan kekuatan nominal) yang bukan yang Anda inginkan. Terlebih lagi, jika suatu prosedur "secara teoretis" bermanfaat, maka tentu saja tidak ada keberatan terhadap penggunaannya dalam praktik, selain tidak praktis (yang biasanya tidak demikian halnya dengan prosedur acak). Dengan demikian pertanyaan Anda harus dihilangkan: beban ada pada Anda untuk menunjukkan ada yang salah dengan menggunakan prosedur acak. Bagaimana Anda mencapai itu tanpa bertentangan dengan diri Anda sendiri?
Whuber

3

Idenya mengacu pada pengujian, tetapi mengingat dualitas pengujian dan interval kepercayaan, logika yang sama berlaku untuk CI.

Pada dasarnya, tes acak memastikan bahwa ukuran tertentu dari tes dapat diperoleh untuk eksperimen bernilai diskrit juga.

α=0.05pH0:p=0.5H1:p<0.5n=10

H0k=2ppbinom(2,10,.5)k=1H0

k=2


α

Yah, saya kira itu membawa kita kembali ke sejarah statistik, ketika RA Fisher agak sewenang-wenang memutuskan untuk bekerja dengan tingkat signifikansi 5% untuk memutuskan apakah beberapa bukti awal memerlukan studi lebih lanjut. Seperti yang kita ketahui, 5% sejak itu telah berubah menjadi semacam standar emas di banyak bidang, meskipun tidak memiliki landasan teori-keputusan yang baik.
Christoph Hanck
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.