Interpretasi interval kepercayaan


16

Catatan: permintaan maaf sebelumnya jika ini adalah duplikat, saya tidak menemukan q serupa dalam pencarian saya

Katakanlah kita memiliki parameter true p. Interval kepercayaan C (X) adalah RV yang berisi p, katakanlah 95% dari waktu. Sekarang anggaplah kita mengamati X dan menghitung C (X). Jawaban yang umum tampaknya adalah bahwa tidak benar untuk menafsirkan ini sebagai memiliki "kemungkinan 95% mengandung p" karena itu "entah itu atau tidak mengandung p"

Namun, katakanlah saya mengambil kartu dari bagian atas geladak yang dikocok dan membiarkannya menghadap ke bawah. Secara intuitif saya berpikir tentang kemungkinan kartu ini menjadi Ace of Spades sebagai 1/52, meskipun dalam kenyataannya "itu ada atau bukan Ace of Spades." Mengapa saya tidak bisa menerapkan alasan ini pada contoh interval kepercayaan?

Atau jika tidak bermakna membicarakan "kemungkinan" kartu menjadi kartu as karena "tidak ada atau tidak", saya masih akan meletakkan peluang 51: 1 bahwa itu bukan kartu as sekop. Apakah ada kata lain untuk menggambarkan informasi ini? Bagaimana konsep ini berbeda dari "probabilitas"?

sunting: Mungkin lebih jelas, dari interpretasi bayesian tentang probabilitas, jika saya diberi tahu bahwa variabel acak mengandung p 95% dari waktu, mengingat realisasi variabel acak tersebut (dan tidak ada informasi lain untuk dikondisikan) apakah itu benar untuk mengatakan variabel acak memiliki probabilitas 95% mengandung p?

sunting: juga, dari interpretasi probabilitas yang sering, katakanlah frequentist setuju untuk tidak mengatakan apa pun seperti "ada kemungkinan 95% bahwa interval kepercayaan mengandung p". Apakah masih logis untuk seorang yang sering memiliki "kepercayaan" bahwa interval kepercayaan mengandung p?

Biarkan alpha menjadi level signifikansi dan biarkan t = 100-alpha. K (t) menjadi "kepercayaan" yang sering dilakukan oleh interval kepercayaan yang berisi hal. Masuk akal bahwa K (t) harus meningkat dalam t. Ketika t = 100%, frequentist harus memiliki kepastian (menurut definisi) bahwa interval kepercayaan berisi p, sehingga kita dapat menormalkan K (1) = 1. Demikian pula, K (0) = 0. Agaknya K (0,95) adalah suatu tempat antara 0 dan 1 dan K (0.999999) lebih besar. Dengan cara apa yang sering dianggap K berbeda dari P (distribusi probabilitas)?


1
Memang, pertimbangkan flip koin di mana koin bergulir di bawah meja, tidak terlihat dan kami menganggap peristiwa bahwa koin mendarat di kepala. Pada pandangan pertama ini tampaknya sangat mirip dengan masalah CI - jelas peristiwa itu terjadi atau tidak. Namun dalam kasus flip koin banyak (mungkin bahkan sebagian besar) frequentis tampaknya sangat senang untuk menetapkan probabilitas nosional, (katakanlah ) untuk koin yang tidak teramati telah berakhir di kepala, sementara mundur dari mengatakan hal yang sama tentang interval acak berisi parameter. Bagi saya sepertinya ada inkonsistensi. p
Glen_b -Reinstate Monica

@Glen_b Sering kali dalam skenario koin terjatuh yang tidak teramati menerapkan alasan kontrafaktual untuk mengatakan, bukan bahwa nilai nominal sebenarnya dari koin itu "acak" (meskipun tidak teramati), tetapi kita dapat menggeneralisasi hasil yang diamati dengan hasil potensial lain pada hasil yang dijatuhkan ini. koin dan hitung probabilitas. Sejauh probabilitas untuk nilai nominal sebenarnya dari koin, itu adalah kepala atau tidak, tidak ada probabilitas. The disimpan untuk pembangunan counterfactual dari pengaturan ini. hal
AdamO

@Glen_b: Saya setuju, lihat pertanyaan saya di sini: stats.stackexchange.com/questions/233588/…
vonjd

@vonjd sejauh mana pertanyaan Anda di sana bukan hanya duplikat dari paragraf pertama setelah pembukaan "Catatan:" di sini?
Glen_b -Reinstate Monica

@ Glen_b: Sejujurnya saya tidak menyadari pertanyaan ini ketika saya memposting pertanyaan saya dan mereka pasti tumpang tindih. Namun saya pikir mereka bukan duplikat karena milik saya umumnya lebih peduli dengan menggunakan probabilitas untuk hasil tersembunyi (yang akan memiliki konsekuensi untuk interval kepercayaan) sedangkan yang ini murni bertujuan pada interval kepercayaan. Tetapi jika Anda berpikir bahwa milik saya adalah duplikat, jangan ragu untuk menutupnya.
vonjd

Jawaban:


8

Saya pikir banyak akun konvensional tentang hal ini tidak jelas.

Katakanlah Anda mengambil sampel ukuran dan mendapatkan interval kepercayaan 95 % untuk hal .10095%p

Kemudian Anda mengambil sampel lain , independen dari yang pertama, dan dapatkan interval kepercayaan 95 % untuk hal .10095%p

Yang berubah adalah interval kepercayaan; apa yang tidak berubah adalah . p Itu berarti bahwa dalam metode frequentist, seseorang mengatakan interval kepercayaan adalah "acak" tetapi adalah "tetap" atau "konstan", yaitu tidak acak. Dalam metode frequentist, seperti metode interval kepercayaan, seseorang menetapkan probabilitas hanya untuk hal-hal yang acak.p

Jadi dan ( L , U ) adalah interval kepercayaan. ( L = "lebih rendah" dan U = "atas".) Ambil sampel baru dan LPr(L<p<U)=0.95(L,U)L=U=L dan berubah tetapi p tidak.Up

Katakanlah dalam contoh tertentu Anda memiliki dan U = 43.61 . Dalam metode frequentist seseorang tidak akan menetapkan probabilitas untuk pernyataan 40.53 < p < 43.61 , selain probabilitas 0 atau 1 , karena tidak ada yang acak di sini: 40.53 tidak acak,L=40.53U=43.6140.53<p<43.610140.53 tidak acak (karena itu tidak akan berubah jika kami mengambil sampel baru), dan 43.61 tidak acak.p43.61

Dalam praktiknya, orang berperilaku seolah-olah mereka yakin bahwa p berada di antara 40,53 dan 43,61 . Dan sebagai hal praktis, itu mungkin sering masuk akal. Tapi terkadang tidak. Salah satu kasus tersebut adalah jika angka yang lebih besar dari 40 atau lebih diketahui sebelumnya tidak mungkin, atau jika mereka diketahui sangat mungkin. Jika seseorang dapat menetapkan beberapa distribusi probabilitas sebelumnya ke p , seseorang menggunakan teorema Bayes untuk mendapatkan interval yang kredibel, yang mungkin berbeda dari interval kepercayaan karena pengetahuan sebelumnya tentang rentang nilai p95%p40.5343.6140ppmungkin atau tidak mungkin. Dapat juga benar-benar terjadi bahwa data itu sendiri --- hal-hal yang berubah jika sampel baru diambil, dapat memberi tahu Anda bahwa tidak mungkin, atau bahkan pasti tidak sebesar 40 . Itu bisa terjadi bahkan dalam kasus di mana pasangan ( L , U ) adalah statistik yang cukup untuk p . Fenomena itu dapat diatasi dalam beberapa kasus dengan metode pengkondisian Fisher pada statistik tambahan. Contoh dari fenomena terakhir ini adalah ketika sampel terdiri dari hanya dua pengamatan independen yang merata dalam interval q ± 1 / 2p40(L,U)pθ±1/2. Kemudian interval dari yang lebih kecil dari dua pengamatan ke yang lebih besar adalah interval kepercayaan . Tetapi jika jarak antara mereka adalah 0,001 , tidak masuk akal untuk berada di dekat 50 % yakin bahwa θ ada di antara mereka, dan jika jaraknya adalah 0,999 , orang akan hampir 100 % yakin θ ada di antara mereka. Jarak antara mereka akan menjadi statistik tambahan yang akan dikondisikan.50%0.00150%θ0.999100%θ


Terima kasih Michael, itu masuk akal. Anggaplah dalam contoh Anda bahwa kami memiliki nilai tertentu (L, U) tetapi nilainya tidak diketahui oleh kami. Yang kita tahu adalah realisasi dari variabel acak interval kepercayaan 95%. Tanpa terlebih dahulu pada parameter atau informasi lain, apakah adil untuk meletakkan peluang 19: 1 yang (L, U) berisi parameter? Jika seorang frequentist bersedia melakukan ini, tetapi tidak menyebut "kesediaannya untuk meletakkan peluang 19: 1 yang berisi parameter" sebuah "probabilitas", apa yang akan kita sebut itu?
applicative_x

Ya, probabilitas itu adalah . Tentunya dalam metode frequentist orang dapat mengatakan bahwa dalam keadaan ketidaktahuan ( L , U ) probabilitasnya adalah 0,95 bahwa interval itu mengandung0.95(L,U)0.95 . Tetapi ketika seseorang memiliki nilai-nilai tertentu, yang tidak acak, frequentist tidak akan menetapkan probabilitas selain 0 atau 1 pada pernyataan, karena nilai-nilai L dan U yangdiketahuitidak acak. p01LU
Michael Hardy

3

Definisi buku teks dari interval kepercayaan % adalah:100×(1α)

Interval yang, di bawah banyak ulangan independen studi dalam kondisi ideal, menangkap pengukuran efek yang direplikasi % dari waktu.100×(1α)

Probabilitas, bagi yang sering datang, berasal dari gagasan "memutar waktu dan ruang" untuk mereplikasi temuan, seolah-olah sejumlah salinan dunia yang tak terbatas diciptakan untuk menilai temuan ilmiah lagi dan lagi dan lagi dan lagi. Jadi probabilitas adalah frekuensi persisnya. Bagi para ilmuwan, ini adalah cara yang sangat mudah untuk membahas temuan, karena prinsip pertama ilmu pengetahuan adalah bahwa studi harus dapat ditiru.

Dalam contoh kartu Anda, kebingungan untuk Bayesians dan Frequentists adalah bahwa frequentist tidak menetapkan probabilitas pada nilai nominal kartu tertentu yang telah Anda balikkan dari geladak sedangkan Bayesian akan melakukannya. Frequentist akan menetapkan probabilitas untuk sebuah kartu, membalik dari atas dek acak dikocok. Seorang Bayesian tidak peduli dengan mereplikasi studi, setelah kartu dibalik, Anda sekarang memiliki 100% keyakinan tentang apa kartu itu dan 0% percaya bahwa itu bisa mengambil nilai lain. Bagi orang Bayesian, probabilitas adalah ukuran keyakinan.

Perhatikan bahwa orang Bayesian tidak memiliki interval kepercayaan untuk alasan ini, mereka meringkas ketidakpastian dengan interval kredibilitas .


Terima kasih atas tanggapannya. Dalam contoh kartu, tidakkah bayesian dan frequentist setuju bahwa 51: 1 adalah peluang yang adil bahwa kartu tersebut adalah kartu as sekop? Demikian pula, untuk realisasi interval kepercayaan 95% (dan tidak ada informasi lain), bukankah keduanya memiliki peluang 19: 1 yang berisi parameter sebenarnya? Dalam pengertian itu, dapatkah bayesian menginterpretasikan interval kepercayaan 95% memiliki kemungkinan 95% berisi parameter sebenarnya?
applicative_x

p=1/52

Terima kasih Adam, saya pikir saya masih bingung. Anggap saja saya tahu (dengan melihat kartu) bahwa kartu 52 kartu standar. Saya mengocok deck dan memilih 10 kartu teratas tanpa melihat mereka. Tidak bisakah saya mendefinisikan "parameter sebenarnya" dalam kasus ini menjadi jumlah kartu merah? Maka terlepas dari bayesian vs frequentist ada "parameter yang benar." Jika saya diizinkan untuk memilih 7 kartu secara acak, saya juga bisa membayangkan membangun interval kepercayaan untuk # kartu merah dari 10. saya
applicative_x

1
1/2

1
@ Adamo: Saya menemukan komentar Anda samar. 'Utilitas apa adalah gagasan "kebenaran" adalah perubahan topik. "Kami menganggap kebenaran sebagai kekal." Jadi "kami" berarti Anda dan siapa lagi, dan apa relevansi dari apa yang mereka pikirkan? "Tidak ada ilmuwan yang akan melakukan pengumpulan data demi memverifikasi sesuatu yang sudah diketahui." Itu tampak seperti perubahan topik pembicaraan lainnya. Kemudian ikuti beberapa komentar pada frequentist dan Bayesians. Saya tidak ingin menebak apa yang ingin Anda katakan.
Michael Hardy
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.