Klarifikasi tentang penafsiran interval kepercayaan?


47

Pemahaman saya saat ini tentang gagasan "interval kepercayaan dengan tingkat kepercayaan " adalah bahwa jika kita mencoba menghitung interval kepercayaan berkali-kali (setiap kali dengan sampel baru), itu akan berisi parameter dari waktu.1 - α1α1α

Meskipun saya menyadari bahwa ini tidak sama dengan "probabilitas bahwa parameter sebenarnya terletak pada interval ini", ada sesuatu yang ingin saya perjelas.

[Pembaruan Utama]

Sebelum kita menghitung interval kepercayaan 95%, ada kemungkinan 95% bahwa interval yang kita hitung akan mencakup parameter sebenarnya. Setelah kami menghitung interval kepercayaan dan mendapatkan interval tertentu , kami tidak bisa lagi mengatakan ini. Kami bahkan tidak dapat membuat semacam argumen non-sering bahwa kami 95% yakin parameter sebenarnya akan terletak pada ; karena jika kita bisa, itu akan bertentangan dengan contoh tandingan seperti ini: Apa, tepatnya, interval kepercayaan?[ a , b ][a,b][a,b]

Saya tidak ingin membuat ini menjadi perdebatan tentang filosofi probabilitas; sebaliknya, saya mencari penjelasan matematis yang tepat tentang bagaimana dan mengapa melihat interval tertentu berubah (atau tidak berubah) probabilitas 95% yang kami miliki sebelum melihat interval itu. Jika Anda berpendapat bahwa "setelah melihat interval, gagasan probabilitas tidak lagi masuk akal", maka baik, mari kita bekerja dalam interpretasi probabilitas di mana ia tidak masuk akal.[a,b]

Lebih tepatnya:

Misalkan kita memprogram komputer untuk menghitung interval kepercayaan 95%. Komputer melakukan beberapa angka, menghitung suatu interval, dan menolak untuk menunjukkan kepada saya interval sampai saya memasukkan kata sandi. Sebelum saya memasukkan kata sandi dan melihat intervalnya (tetapi setelah komputer menghitungnya), berapa probabilitas interval tersebut akan berisi parameter yang benar? 95%, dan bagian ini tidak cocok untuk diperdebatkan : ini adalah interpretasi probabilitas yang saya minati untuk pertanyaan khusus ini (saya menyadari ada masalah filosofis utama yang saya tekan, dan ini disengaja).

Tetapi begitu saya mengetikkan kata sandi dan membuat komputer menunjukkan kepada saya interval yang dihitungnya, probabilitas (bahwa interval tersebut berisi parameter sebenarnya) dapat berubah. Klaim apa pun yang probabilitas ini tidak pernah berubah akan bertentangan dengan sampel tandingan di atas. Dalam contoh tandingan ini, probabilitas dapat berubah dari 50% menjadi 100%, tetapi ...

  • Apakah ada contoh di mana probabilitas berubah menjadi sesuatu selain 100% atau 0% (EDIT: dan jika demikian, apa itu)?

  • Adakah contoh di mana probabilitas tidak berubah setelah melihat interval tertentu (yaitu probabilitas bahwa parameter sebenarnya terletak pada masih 95%)?[ a , b ][a,b][a,b]

  • Bagaimana (dan mengapa) perubahan probabilitas secara umum setelah melihat komputer meludahkan ?[a,b]

[Sunting]

Terima kasih atas semua jawaban dan diskusi bermanfaat!


1
Ini mungkin memberikan beberapa poin menarik: en.wikipedia.org/wiki/Credible_interval
nico

Asumsi Anda bahwa P (E | C) = 1 dan P (E | C ') = 0 tidak dapat dibenarkan. Mengapa Anda menyatakan bahwa jika interval aktual tidak mengandung nilai parameter sebenarnya yang terakhir ini pasti di luar itu?
kaca

Saya tidak yakin apa yang Anda maksud dengan "interval aktual" atau "yang terakhir". Bisakah Anda mengklarifikasi?
Elliott

@nico Terima kasih atas tautannya. Maksud dari pertanyaan awal saya adalah "argumen saya tampaknya menunjukkan bahwa interval kepercayaan dapat diartikan sebagai interval kredibel Bayesian, tetapi ini tidak terjadi, jadi apa yang salah dengan alasan saya". Tetapi saya harus mengakui, saya tidak senang dengan anggapan "probabilitas bahwa interval berisi parameter benar [tidak diketahui] adalah 0 atau 1". Bagi saya, itu seperti mengatakan "probabilitas bahwa koin mendarat, setelah saya membaliknya tetapi sebelum saya melihatnya, adalah 0 atau 1"; Saya tidak mengerti mengapa ini bukan 1/2.
Elliott

@ Elliot: Kucing Schrödinger muncul di benak saya :) Saya tidak cukup ahli untuk memberi Anda penjelasan yang tepat, tetapi saya akan senang melihat jawaban untuk ini. PS: dan jangan lupa bahwa koin itu juga bisa jatuh ke tepi!
nico

Jawaban:


28

Saya pikir masalah mendasar adalah bahwa statistik frequentist hanya dapat menetapkan probabilitas untuk sesuatu yang dapat memiliki frekuensi jangka panjang. Apakah nilai sebenarnya dari suatu parameter terletak pada interval tertentu atau tidak, tidak memiliki frekuensi jangka panjang, karena kami hanya dapat melakukan eksperimen satu kali, sehingga Anda tidak dapat menetapkan probabilitas yang sering terjadi padanya. Masalah muncul dari definisi probabilitas. Jika Anda mengubah definisi probabilitas menjadi probabilitas Bayesian, maka masalah tersebut langsung hilang karena Anda tidak lagi terikat pada diskusi tentang frekuensi jangka panjang.

Lihat jawaban saya (agak tersinggung di pipi) untuk pertanyaan terkait di sini :

" Seorang Frequentist adalah seseorang yang percaya bahwa probabilitas mewakili frekuensi jangka panjang yang dengannya peristiwa terjadi; jika perlu, ia akan menciptakan populasi fiktif yang darinya situasi khusus Anda dapat dianggap sebagai sampel acak sehingga ia dapat berbicara dengan bermakna tentang frekuensi jangka panjang. Jika Anda bertanya kepadanya tentang situasi tertentu, dia tidak akan memberikan jawaban langsung, tetapi malah membuat pernyataan tentang populasi (mungkin imajiner) ini. "

Dalam kasus interval kepercayaan, pertanyaan yang biasanya ingin kita tanyakan (kecuali kita memiliki masalah dalam kontrol kualitas misalnya) adalah "diberikan sampel data ini, kembalikan interval terkecil yang berisi nilai sebenarnya dari parameter dengan probabilitas X ". Namun seorang frequentist tidak dapat melakukan ini karena percobaan hanya dilakukan sekali dan karenanya tidak ada frekuensi jangka panjang yang dapat digunakan untuk menetapkan suatu probabilitas. Jadi alih-alih yang sering harus menemukan populasi percobaan (yang tidak Anda lakukan) dari mana percobaan yang Anda lakukan dapat dianggap sebagai sampel acak. Sering itu kemudian memberi Anda jawaban tidak langsung tentang populasi percobaan fiktif itu, daripada jawaban langsung untuk pertanyaan yang benar-benar ingin Anda tanyakan tentang eksperimen tertentu.

Pada dasarnya ini adalah masalah bahasa, definisi popuation yang sering muncul tidak memungkinkan diskusi tentang kemungkinan nilai sebenarnya dari sebuah parameter yang terletak pada interval tertentu. Itu tidak berarti statistik frequentist buruk, atau tidak berguna, tetapi penting untuk mengetahui keterbatasannya.

Mengenai pembaruan utama

Saya tidak yakin kita dapat mengatakan bahwa "Sebelum kita menghitung interval kepercayaan 95%, ada kemungkinan 95% bahwa interval yang kita hitung akan mencakup parameter sebenarnya." dalam kerangka kerja frequentist. Ada kesimpulan implisit di sini bahwa frekuensi jangka panjang yang dengannya nilai sebenarnya dari parameter terletak pada interval kepercayaan yang dibangun oleh beberapa metode tertentu juga kemungkinan bahwa nilai sebenarnya dari parameter akan terletak pada interval kepercayaan untuk sampel tertentu. data yang akan kita gunakan. Ini adalah kesimpulan yang masuk akal, tetapi merupakan kesimpulan Bayesian, bukan yang sering, karena probabilitas bahwa nilai sebenarnya dari parameter terletak pada interval kepercayaan yang kami buat untuk sampel data tertentu tidak memiliki freqency jangka panjang, karena kami hanya memiliki satu sampel data.

Namun kita dapat "membuat semacam argumen non-sering bahwa kita 95% yakin parameter sebenarnya akan terletak pada [a, b]", itulah yang merupakan interval kredibel Bayesian, dan untuk banyak masalah interval kredibel Bayesian persis bertepatan dengan interval kepercayaan yang sering terjadi.

"Saya tidak ingin membuat ini menjadi perdebatan tentang filosofi probabilitas", sayangnya hal ini tidak dapat dihindari, alasan mengapa Anda tidak dapat menetapkan probabilitas frequentist untuk apakah nilai sebenarnya dari statistik terletak pada interval kepercayaan adalah konsekuensi langsung dari filosofi probabilitas probabilitas. Frequentists hanya dapat menetapkan probabilitas untuk hal-hal yang dapat memiliki frekuensi jangka panjang, karena itulah bagaimana frequentist menentukan probabilitas dalam filosofi mereka. Itu tidak membuat filosofi frequentist salah, tetapi penting untuk memahami batasan yang ditentukan oleh definisi probabilitas.

"Sebelum saya memasukkan kata sandi dan melihat intervalnya (tetapi setelah komputer menghitungnya), berapa probabilitas interval tersebut berisi parameter sebenarnya? Ini 95%, dan bagian ini tidak cocok untuk diperdebatkan:" Ini tidak benar, atau setidaknya dalam membuat pernyataan seperti itu, Anda telah berangkat dari kerangka kerja statistik frequentist dan telah membuat kesimpulan Bayesian yang melibatkan tingkat masuk akal dalam kebenaran pernyataan, daripada frekuensi jangka panjang. Namun, seperti yang telah saya katakan sebelumnya, ini adalah kesimpulan yang masuk akal dan alami.

Tidak ada yang berubah sebelum atau setelah memasukkan kata sandi, karena peristiwa niether dapat ditetapkan sebagai probabilitas yang sering terjadi. Statistik Frequentist dapat menjadi agak kontra-intuitif karena kita sering ingin bertanya tentang tingkat pernyataan yang masuk akal mengenai peristiwa-peristiwa tertentu, tetapi ini berada di luar jangkauan statistik frequentist, dan ini adalah asal dari kebanyakan interpretasi yang keliru dari prosedur yang sering terjadi.


2
Ya, itulah yang saya maksud, pernyataan kedua sebenarnya bukan pernyataan tentang koin khusus ini. Ini adalah pernyataan tentang populasi koin imajiner yang kebanyakan orang salah intepret sebagai pernyataan tentang koin khusus kami. Namun dalam membuat lompatan itu kita menerapkan intuisi Bayesian tentang probabilitas, dan mengabaikan apa sebenarnya interval kepercayaan itu. Tidak ada masalah dalam menetapkan probabilitas ke keadaan koin, asalkan kita menjauh dari definisi probabilitas yang sering.
Dikran Marsupial

2
Untuk memperjelas, untuk mengatakan bahwa "bayangkan banyak contoh terpisah dari awal waktu; Anda akan mengharapkan sekitar setengah dari mereka untuk menghasilkan kepala" adalah alasan yang sering benar. Namun untuk pergi dari sana ke "karena itu probabilitas bahwa koin partikel ini juga 0,5" tidak sebagai probabilitas diterapkan pada sesuatu yang tidak memiliki frekuensi jangka panjang karena hanya dapat terjadi sekali dan hanya sekali saja. Ini adalah alasan Bayesian yang masuk akal, karena probabilitas Bayesian adalah pernyataan tentang kemungkinan masuknya suatu proposisi (yang dapat didasarkan pada frekuensi jangka panjang dalam suatu populasi).
Dikran Marsupial

1
Jawabannya untuk kedua pertanyaan itu sebenarnya adalah pernyataan tentang proporsi populasi koin imajiner yang akan mendarat. Tetapi ada kemungkinan bahwa ini tidak akan dibuat eksplisit, karena orang umumnya suka membantu (jawaban tidak langsung umumnya tidak membantu), dan juga statistik frequentist agak kontra-intuitif dan frequentist cenderung mengitari titik ini untuk menghindari kebingungan. Jika ditekan untuk membuat statability probabilistik tentang flip tertentu, frequentist yang baik hanya akan menolak untuk menjawab - itu terletak di luar batas-batas stat frequentist.
Dikran Marsupial

1
Pada dasarnya, frequentist tidak akan benar-benar menjawab pertanyaan Anda, dia akan membuat pernyataan tentang populasi koin yang terbalik dan membuat Anda menyimpulkan bahwa probabilitas kepala pada flip tertentu sama dengan proporsi dalam populasi implisit . Tapi itu akan menjadi kesimpulan Bayesianmu, bukan miliknya.
Dikran Marsupial

1
@ Harun Tentu, Anda bisa mengatakan "probabilitasnya 0 atau 1" untuk banyak hal, tetapi jawaban itu sama sekali tidak memberi kita apa-apa (misalnya, jika kita ingin menjawab pertanyaan konkret tentang berapa banyak kita harus bertaruh pada permainan atau apakah atau tidak kita harus meluncurkan pesawat ulang-alik). Selain itu, hal-hal yang "bisa terjadi" adalah: (1) koin mendarat kepala dan Anda menutupinya, (2) koin mendarat ekor dan Anda menutupinya; dalam "populasi imajiner" dari banyak percobaan "membalik dan menutupi", sekitar 50% menghasilkan Anda melihat kepala.
Elliott

14

Pembaruan besar, jawaban baru utama. Biarkan saya mencoba untuk dengan jelas membahas hal ini, karena di situlah masalahnya:

"Jika Anda berpendapat bahwa" setelah melihat interval, gagasan tentang probabilitas tidak lagi masuk akal ", maka baiklah, mari kita bekerja dalam interpretasi probabilitas di mana ia masuk akal."

Aturan probabilitas tidak berubah tetapi model Anda untuk semesta tidak berubah. Apakah Anda bersedia untuk mengukur keyakinan Anda sebelumnya tentang parameter menggunakan distribusi probabilitas? Apakah memperbarui distribusi probabilitas setelah melihat data merupakan hal yang wajar untuk dilakukan? Jika Anda berpikir demikian maka Anda dapat membuat pernyataan seperti . Distribusi saya sebelumnya dapat mewakili ketidakpastian saya tentang keadaan alam yang sebenarnya , bukan hanya keacakan seperti yang biasa dipahami - yaitu, jika saya menetapkan distribusi sebelumnya ke jumlah bola merah dalam sebuah guci itu tidak berarti saya pikir jumlahnya bola merah adalah acak. Sudah diperbaiki, tapi saya tidak yakin tentang itu.P(θ[L(X),U(X)]|X=x)

Beberapa orang termasuk saya telah mengatakan ini, tetapi jika Anda tidak bersedia memanggil sebagai variabel acak maka pernyataan tidak berarti. Jika saya sering, saya memperlakukan sebagai kuantitas tetap DAN saya tidak bisa menganggap distribusi probabilitas untuk itu. Mengapa? Karena sudah diperbaiki, dan interpretasi saya tentang probabilitas adalah dalam hal frekuensi jangka panjang. Jumlah bola merah di dalam guci tidak pernah berubah. adalah apa itu . Jika saya mengeluarkan beberapa bola maka saya memiliki sampel acak. Saya dapat bertanya apa yang akan terjadi jika saya mengambil banyak sampel acak - artinya, saya dapat berbicara tentangP ( θ [ L ( X ) , U ( X ) ] | X = x ) θ θ θ P ( θ [ L ( X ) , U ( X ) ] )θP(θ[L(X),U(X)]|X=x)θθθP(θ[L(X),U(X)]) karena interval tergantung pada sampel, yang (tunggu!) acak.

Tetapi Anda tidak menginginkan itu. Anda ingin - berapa probabilitas interval yang saya buat dengan sampel yang saya amati (dan sekarang diperbaiki) ini berisi parameter. Namun, setelah Anda mengkondisikan lalu kepada saya, sering, tidak ada yang tersisa secara acak dan pernyataan tidak Tidak masuk akal dengan cara apa pun yang berarti.X = x P ( θ [ L ( X ) , U ( X ) ] | X = x )P(θ[L(X),U(X)]|X=x)X=xP(θ[L(X),U(X)]|X=x)

Satu-satunya cara berprinsip (IMO) untuk membuat pernyataan tentang adalah untuk mengukur ketidakpastian kita tentang suatu parameter dengan distribusi probabilitas (sebelum) dan perbarui distribusi itu dengan informasi baru melalui Bayes Theorem. Setiap pendekatan lain yang saya lihat adalah pendekatan yang kurang bagus untuk Bayes. Anda tentu tidak dapat melakukannya dari perspektif yang sering.P(θ[L(X),U(X)]|X=x)

Itu bukan untuk mengatakan bahwa Anda tidak dapat mengevaluasi prosedur frequentist tradisional dari perspektif Bayesian (misalnya interval kepercayaan hanya interval yang kredibel di bawah prior uniform, misalnya) atau bahwa mengevaluasi estimator Bayesian / interval kredibel dari perspektif frequentist tidak berharga (Saya pikir itu bisa). Bukan untuk mengatakan bahwa statistik klasik / sering tidak berguna, karena tidak. Itu adalah apa adanya, dan kita seharusnya tidak mencoba membuatnya lebih.

Apakah menurut Anda masuk akal untuk memberikan parameter distribusi sebelumnya untuk mewakili keyakinan Anda tentang alam semesta? Kedengarannya seperti itu dari komentar Anda yang Anda lakukan; dalam pengalaman saya kebanyakan orang akan setuju (itulah setengah-lelucon kecil yang saya buat dalam komentar saya ke @G. Jawaban Jay Kerns). Jika demikian, paradigma Bayesian menyediakan cara yang logis dan koheren untuk membuat pernyataan tentang . Pendekatan frequentist tidak.P(θ[L(X),U(X)]|X=x)


1
(+1) dilakukan dengan sangat baik, sekali lagi, dan temukan dead-center.

+1 Komentar yang sama seperti di atas (lihat jawaban G. Jay Kerns); ini sangat membantu.
Elliott

Bounty schmounty :) Saya senang Anda merasa terbantu.
JMS

11

OKE, sekarang kamu bicara! Saya memilih untuk menghapus jawaban saya sebelumnya karena tidak masuk akal dengan pertanyaan besar yang diperbarui ini.

Dalam pertanyaan baru yang diperbarui ini, dengan komputer yang menghitung interval kepercayaan 95%, di bawah interpretasi ortodoks yang sering terjadi, berikut adalah jawaban untuk pertanyaan Anda:

  1. Tidak.
  2. Tidak.
  3. Setelah interval diamati, itu tidak acak lagi, dan tidak berubah. (Mungkin intervalnya adalah .) Tetapi juga tidak berubah, dan tidak pernah berubah. (Mungkin ) Probabilitasnya berubah dari 95% menjadi 0% karena 95% interval yang dihitung komputer mencakup 7, tetapi 100% interval TIDAK mencakup 7.θ θ = 7 [ 1 , 3 ][1,3]θθ=7[1,3]

(Ngomong-ngomong, di dunia nyata, pelaku eksperimen tidak pernah tahu bahwa , yang berarti pelaku eksperimen tidak akan pernah tahu apakah probabilitas sebenarnya mencakup adalah nol atau satu. (S) ia hanya dapat mengatakan bahwa itu harus salah satu atau yang lain.) Itu, ditambah eksperimen dapat mengatakan bahwa 95% dari interval komputer mencakup , tetapi kami sudah tahu itu.[ 1 , 3 ] θ θθ=7[1,3]θθ

Semangat pertanyaan Anda terus mengisyaratkan kembali ke pengetahuan pengamat , dan bagaimana itu berhubungan dengan di mana berada. Itu (mungkin) adalah mengapa Anda berbicara tentang kata sandi, tentang komputer yang menghitung interval tanpa Anda melihatnya, dll . Saya telah melihat di komentar Anda untuk jawaban yang tampaknya tidak memuaskan / tidak pantas untuk berkomitmen untuk 0 atau 1, setelah semua, mengapa kita tidak percaya itu 87%, atau , atau bahkan 99% ?? ? Tapi itu persis kekuatan - dan sekaligus tumit Achilles - dari kerangka kerja yang sering terjadi: pengetahuan / kepercayaan subjektif dari pengamat tidak relevan. Yang penting hanyalah frekuensi relatif jangka panjang. Tidak lebih, tidak kurang.15 / 16θ15/16

Sebagai BTW final: jika Anda mengubah interpretasi probabilitas Anda (yang Anda pilih untuk tidak melakukan pertanyaan ini), maka jawaban baru adalah:

  1. Iya.
  2. Iya.
  3. Probabilitas berubah karena probabilitas = pengetahuan subyektif, atau tingkat kepercayaan, dan pengetahuan pengamat berubah. Kami mewakili pengetahuan dengan distribusi sebelum / posterior, dan ketika informasi baru tersedia, yang pertama berubah menjadi yang terakhir (melalui Bayes 'Rule).

(Tetapi untuk pengungkapan penuh, pengaturan yang Anda gambarkan tidak cocok dengan interpretasi subjektif dengan sangat baik. Misalnya, kami biasanya memiliki interval kredibel sebelum 95% bahkan sebelum menyalakan komputer, kemudian kami jalankan dan gunakan komputer untuk memberikan kami interval kredibel posterior 95% yang biasanya jauh lebih kurus dari yang sebelumnya.)


Lagi! :) Sudah selesai dilakukan dengan baik.
JMS

3
Saya hanya harus menunjukkan bahwa interpretasi Bayesian tentang probabilitas belum tentu subjektif, sehingga tidak benar-benar kekuatan dari pendekatan yang sering terjadi. Dalam kasus pendekatan Bayesian objektif untuk "probabilitas pendaratan koin menyebabkan masalah", menggunakan informasi sebelumnya tidak melibatkan tidak melibatkan subjektivitas sama sekali. Kekuatan sebenarnya dari pendekatan frequentist terletak pada masalah seperti kontrol kualitas, di mana wajar untuk berbicara tentang uji coba berulang dan frekuensi jangka panjang. Hanya mengalami kesulitan ketika Anda mengajukan pertanyaan tentang peristiwa tertentu.
Dikran Marsupial

@ SM, terima kasih. @Dikran, sulit untuk membicarakannya dengan 544 karakter dalam kotak kecil di layar komputer. Secara singkat: Saya setuju dengan Anda bahwa kata "Bayesian" tidak identik dengan "subyektif". Dan tidak ada gunanya mencoba menentukan di mana kekuatan sebenarnya dari kedua pendekatan itu benar-benar terletak. Intinya: kita semua bisa sepakat tentang frekuensi relatif jangka panjang, tetapi lebih sering daripada tidak, posterior Anda akan berbeda dari saya.

2
@Dikran Marsupial Anda membuat poin yang bagus. Saya hanya akan menambahkan bahwa begitu kita memindahkan masalah mainan masa lalu ke dalam pemodelan terapan yang sebenarnya, sering kali terjadi bahwa subjektivitas yang benar-benar penting datang melalui bagaimana kita menentukan kemungkinannya, belum tentu distribusi sebelumnya sendiri (Apakah pengamatan itu benar-benar dapat dipertukarkan? Gaussian? dll). Dengan cara itu, subjektivitas dibangun menjadi bagian besar dari statistik berbasis model, Bayesian dan sering juga sama.
JMS

+1 Terima kasih atas jawaban yang indah. Ini jelas layak mendapat hadiah, tetapi untuk menghindari politik, saya akhirnya memilih upvote.
Elliott

6

Saya akan memasukkan dua sen saya (mungkin menguji ulang beberapa jawaban sebelumnya). Bagi seorang frequentist, interval kepercayaan itu sendiri pada dasarnya adalah variabel acak dua dimensi: jika Anda mengulang eksperimen sebanyak satu kali, interval kepercayaan yang Anda perkirakan (yaitu: menghitung dari data yang baru Anda temukan setiap kali) akan berbeda setiap kali . Dengan demikian, dua batas interval adalah variabel acak.

Maka, 95% CI berarti tidak lebih dari jaminan (mengingat semua asumsi Anda yang mengarah ke CI ini benar) bahwa rangkaian variabel acak ini akan berisi nilai sebenarnya (ekspresi yang sangat sering) pada 95% kasus.

Anda dapat dengan mudah menghitung interval kepercayaan untuk rata-rata 100 penarikan dari distribusi normal standar. Kemudian, jika Anda menggambar 10.000 kali nilai 100 dari distribusi normal standar, dan setiap kali menghitung interval kepercayaan untuk rata-rata, Anda memang akan melihat bahwa 0 ada di sana sekitar 9500 kali.

Kenyataan bahwa Anda telah menciptakan sebuah interval kepercayaan hanya sekali (dari data Anda yang sebenarnya) memang mengurangi kemungkinan nilai sebenarnya berada di bahwa interval 0 atau 1, tapi itu tidak mengubah probabilitas interval kepercayaan sebagai variabel acak mengandung nilai sebenarnya.

Jadi, intinya: probabilitas setiap (yaitu rata-rata) 95% interval kepercayaan yang mengandung nilai sebenarnya (95%) tidak berubah, dan begitu juga dengan probabilitas interval tertentu (CI atau apa pun) untuk mengandung nilai sebenarnya (0 atau 1). Probabilitas interval yang diketahui komputer tetapi Anda tidak benar-benar 0 atau 1 (karena ini adalah interval tertentu), tetapi karena Anda tidak mengetahuinya (dan, secara sering, tidak dapat menghitung ulang interval yang sama ini) berkali-kali tak terhingga dari data yang sama), yang harus Anda lakukan adalah probabilitas interval apa pun.


Catatan lucu: pemeriksa ejaan situs ini menemukan kata frequentist layak digarisbawahi keriting. Apakah situs ini diam-diam dikuasai oleh bayesians? Oh, kurasa tidak, karena bayesian memiliki garis bawah keritingnya sendiri :-)
Nick Sabbe

4

Alasan bahwa interval kepercayaan tidak menentukan "probabilitas bahwa parameter sebenarnya terletak pada interval" adalah karena begitu interval ditentukan, paramater berada di dalamnya atau tidak. Namun, untuk interval kepercayaan 95% misalnya, Anda memiliki peluang 95% untuk membuat interval kepercayaan yang memang mengandung nilai. Ini adalah konsep yang cukup sulit untuk dipahami, jadi saya mungkin tidak mengartikulasikannya dengan baik. Lihat http://frank.itlab.us/datamodel/node39.html untuk klarifikasi lebih lanjut.


2
Misalkan Anda memprogram komputer untuk menghitung interval kepercayaan, tetapi Anda tidak melihat output. Sebelum Anda melihat hasilnya, Anda tahu bahwa ada kemungkinan 95% bahwa interval mengandung parameter yang tepat (seperti sebelum Anda melihat hasil dari koin flip, Anda tahu ada kemungkinan 50% dari kepala). Dengan cara apa kemudian melihat output mengubah probabilitas ini, mengingat bahwa Anda tidak tahu parameter yang tepat di tempat pertama (saya setuju bahwa dengan melihat hasil dari flip koin mengubah probabilitas kepala dari 50% menjadi 1 atau 0)?
Elliott

Selain itu, sementara saya setuju bahwa ada perbedaan, saya bertanya-tanya apa yang salah dengan "argumen" saya di atas yang menunjukkan bahwa mereka adalah hal yang sama.
Elliott

2
@ Elliott Pertanyaan Anda tampaknya sama dengan analogi ini: Anda melempar koin yang adil. Ergo, probabilitas kepala adalah 50%. Sekarang Anda melihat koin dan itu adalah kepala. Dengan cara apa ini mengubah probabilitas kepala? Jawabannya adalah tidak, karena probabilitas mengacu pada prosedur membalik koin, bukan pada hasilnya. Sepertinya saya bahwa sampel tandingan yang Anda lihat berfungsi dengan cara yang serupa: prosedur mungkin memiliki peluang 50% untuk menutupi parameter, tetapi setelah faktanya dimungkinkan untuk memverifikasi bahwa parameter memang tertutup. Terus?
Whuber

Saya tidak berbicara tentang mengubah probabilitas bahwa koin yang adil akan menjadi kepala; sebagai gantinya, saya berbicara tentang mengubah probabilitas bahwa koin khusus ini akan menjadi kepala. Setelah saya membalik dan sebelum saya melihatnya, saya berpendapat bahwa probabilitas yang dimaksud adalah 50% karena sekitar setengah dari kasus tersebut melibatkan koin dengan kepala di atas. Di sisi lain, setelah saya melihatnya dan melihat kepala, 100% dari kasus tersebut melibatkan koin dengan kepala di atas (kasing dengan ekor di atas dihilangkan ketika saya melihat koin dan tidak melihat kepala).
Elliott

Saya setuju bahwa setelah faktanya, dimungkinkan untuk memverifikasi bahwa parameter telah dicakup. Jawaban saya untuk "jadi apa?" adalah "jadi argumen saya di atas (dalam pertanyaan asli) pasti salah, dan saya ingin tahu ada apa dengan itu".
Elliott

4

Saya tidak berpikir seorang frequentist dapat mengatakan ada kemungkinan nilai (populasi) sebenarnya dari suatu statistik terletak pada interval kepercayaan untuk sampel tertentu. Entah itu benar atau tidak, tetapi tidak ada frekuensi jangka panjang untuk peristiwa tertentu, hanya populasi peristiwa yang akan Anda peroleh dengan kinerja prosedur statistik yang berulang. Inilah sebabnya mengapa kita harus tetap dengan pernyataan seperti "95% interval kepercayaan yang dibangun akan mengandung nilai sebenarnya dari statistik", tetapi tidak "ada p% probabilitas bahwa nilai sebenarnya terletak pada interval kepercayaan yang dihitung untuk khusus ini Sampel". Ini berlaku untuk setiap nilai p, itu tidak mungkin dengan definisi sering tentang apa sebenarnya probabilitas. Seorang Bayesian dapat membuat pernyataan seperti itu menggunakan interval yang kredibel.


3

E[a,b]

E~(L(X),U(X))

Edit: @G. Jay Kerns membuat argumen lebih baik dari saya, dan mengetik lebih cepat, jadi mungkin hanya bergerak :)


[a,b]

2
|

Saya tidak tahu, milik Anda tepat. :-)

2

E[a,b]ECCP(E|C)=P(E)P(E|C)=P(E)

P(E|C)=1P(E|C)=0


Mempertimbangkan bahwa saya mendefinisikan C sebagai kejadian bahwa interval khusus ini, [a, b], berisi parameter sebenarnya, saya tidak yakin saya setuju bahwa E dan C / C 'independen: mengetahui bahwa C terjadi menjamin bahwa E terjadi .
Elliott

Tetapi C adalah variabel acak! Anda agak mengubah definisi semua peristiwa ini setelah semuanya terjadi. Dengan kata lain, jika Anda mendefinisikan C sebagai peristiwa khusus ini, maka C tidak lagi menjadi interval kepercayaan diri.
raegtin

2
Masalahnya adalah bahwa jika C adalah peristiwa di mana interval berisi parameter sebenarnya dalam menjalankan percobaan ini, itu tidak memiliki frekuensi jangka panjang (menjalankan tertentu hanya dapat terjadi sekali), dan dengan demikian Anda tidak dapat menetapkan probabilitas sering untuk itu. Inilah sebabnya mengapa definisi interval kepercayaan sering dalam hal populasi percobaan direplikasi. Anda tampaknya menerapkan penalaran Bayesian ke pengaturan yang sering, dan ada yang tidak cocok dengan definisi probabilitas.
Dikran Marsupial

Berikut cara lain untuk melihatnya. Apa yang tampaknya Anda lakukan adalah sebagai berikut: menjalankan perhitungan untuk mendapatkan interval kepercayaan [a, b]. Tetapkan C sebagai peristiwa bahwa interval kepercayaan khusus ini [a, b] berisi parameter sebenarnya. Tentukan juga E sebagai peristiwa bahwa interval khusus ini [a, b] berisi parameter sebenarnya. Jadi, E dan C adalah acara yang sama!
raegtin

Itulah yang sebenarnya Anda lakukan. Sepertinya Anda berpikir Anda melakukan yang berikut (yang bukan): jalankan perhitungan # 1 untuk mendapatkan interval [a, b]. Tetapkan E sebagai peristiwa bahwa interval khusus ini [a, b] berisi parameter sebenarnya. Selanjutnya, lupakan kalkulasi # 1, dan tentukan C sebagai kejadian dimana interval yang dihitung lainnya [a ', b'] berisi parameter sebenarnya. Dalam hal ini, E dan C bersifat independen.
raegtin

2

Ada begitu banyak penjelasan panjang di sini sehingga saya tidak punya waktu untuk membacanya. Tapi saya pikir jawaban atas pertanyaan dasar bisa pendek dan manis. Ini adalah perbedaan antara probabilitas yang tidak bersyarat pada data. Probabilitas 1-alpha sebelum mengumpulkan tanggal adalah probabilitas bahwa prosedur yang didefinisikan dengan baik akan memasukkan parameter. Setelah Anda mengumpulkan data dan mengetahui interval spesifik yang telah Anda hasilkan, intervalnya tetap dan karena parameternya konstan, probabilitas kondisional ini adalah 0 atau 1. Tetapi karena kita tidak tahu nilai sebenarnya dari parameter tersebut, bahkan setelah mengumpulkan data, kami tidak tahu nilainya.

Perpanjangan pos oleh Michael Chernick menyalin komentar formulir:

ada pengecualian patologis untuk ini yang bisa disebut estimasi sempurna. Misalkan kita memiliki proses autoregresif urutan pertama yang diberikan oleh X (n) = pX (n-1) + en. Itu diam sehingga kita tahu p bukan 1 atau -1 dan <1 dalam nilai absolut. Sekarang en terdistribusi secara independen identik dengan distribusi campuran, ada probabilitas positif q bahwa en = 0

Ada pengecualian patologis untuk ini yang bisa disebut estimasi sempurna. Misalkan kita memiliki proses autoregresif urutan pertama yang diberikan oleh X (n) = pX (n-1) + en. Itu diam sehingga kita tahu p bukan 1 atau -1 dan <1 dalam nilai absolut.

Sekarang en secara independen terdistribusi secara identik dengan distribusi campuran, ada probabilitas positif q bahwa en = 0 dan dengan probabilitas 1-q memiliki distribusi yang benar-benar kontinu (katakanlah bahwa kepadatannya bukan nol dalam interval yang dibatasi dari 0. Kemudian kumpulkan data dari deret waktu secara berurutan dan untuk masing-masing pasangan estimasi nilai berturut-turut p oleh X (i) / X (i-1). Sekarang ketika ei = 0 rasionya akan sama dengan p tepat.

Karena q lebih besar dari 0 akhirnya rasio akan mengulangi nilai dan nilai itu harus menjadi nilai tepat dari parameter p karena jika bukan nilai ei yang bukan 0 akan mengulangi dengan probabilitas 0 dan ei / x (i -1) tidak akan diulang.

Jadi aturan pemberhentian berurutan adalah untuk sampel sampai rasio berulang tepat kemudian menggunakan nilai yang diulang sebagai estimasi p. Karena p persis interval apa pun yang Anda buat yang berpusat pada perkiraan ini memiliki probabilitas 1 termasuk parameter sebenarnya. Meskipun ini adalah contoh patologis yang tidak praktis ada proses stochastic stasioner dengan sifat-sifat yang kita butuhkan untuk distribusi kesalahan


2
sudahkah Anda mempertimbangkan untuk menambahkan contoh yang dijelaskan selama beberapa komentar ini ke jawaban Anda, sebagai gantinya?
Makro

@Michael saya akan komentar kedua Makro. Harap perhatikan bahwa komentar umumnya dianggap sebagai cara untuk berinteraksi dengan pengguna lain (misalnya, ketika meminta klarifikasi, dll.), Dan dalam hal apa pun kadang-kadang dipandang sebagai ' warga negara kelas tiga di Stack Exchange '. Namun, mengikuti pertukaran terbaru kami, saya akan membiarkan Anda memutuskan bagaimana untuk melanjutkan serangkaian komentar ini. Komentar ini berlaku untuk serangkaian komentar lain yang ditemukan di sini .
chl

Saya tidak memberikan komentar dalam jawaban karena tampaknya ada kebijakan untuk menurunkan pilihan jawaban yang memiliki banyak diskusi di dalamnya khususnya ketika seseorang menilai bahwa jawabannya tidak benar-benar menjawab pertanyaan. Jadi jawabannya adalah memberikan jawaban dan komentar masuk di bawah komentar. Komentar saya cenderung melebihi batas karakter jadi saya gunakan beberapa.
Michael Chernick

@MichaelChernick Tidak ada kebijakan seperti itu, jadi saya memasukkan komentar Anda ke dalam pos.

1
@MichaelChernick, saya telah memposting di situs ini dengan cukup teratur selama sekitar satu tahun dan saya tidak pernah mendengar ada yang menyarankan bahwa moderator bersifat opresif atau bahwa aturan situs membingungkan. Masalah yang Anda temui adalah: posting Anda adalah hal-hal yang secara eksplisit dibahas dalam FAQ.
Makro

1

Dua pengamatan tentang banyak pertanyaan dan tanggapan yang mungkin masih membantu.

Bagian dari kebingungan datang dari menyelinap beberapa matematika yang lebih dalam dari teori probabilitas, yang, omong-omong, tidak pada pijakan matematika perusahaan sampai sekitar 1940-an. Ini masuk ke dalam apa yang merupakan ruang sampel, ruang probabilitas, dll.

Pertama, Anda telah menyatakan bahwa setelah flip koin kita tahu bahwa ada kemungkinan 0% itu tidak muncul ekor jika muncul kepala. Pada titik itu, tidak masuk akal untuk berbicara tentang probabilitas; apa yang terjadi terjadi, dan kita tahu itu. Probabilitas adalah tentang yang tidak diketahui di masa depan, bukan yang diketahui di masa sekarang.

Sebagai konsekuensi kecil terhadap arti nol probabilitas sebenarnya, pertimbangkan ini: kita asumsikan jumlah yang adil memiliki probabilitas 0,5 untuk muncul kepala, dan 0,5 untuk muncul ekor. Ini berarti ia memiliki peluang 100% untuk muncul baik kepala atau ekor, karena hasil tersebut adalah MECE (saling eksklusif dan sepenuhnya lengkap). Namun, perubahan nol persen untuk menyusun kepala dan ekor : Gagasan kami tentang 'kepala' dan 'ekor' adalah bahwa mereka saling eksklusif. Dengan demikian, ini memiliki peluang nol persen karena tidak mungkin dalam cara kita memikirkan (atau mendefinisikan) 'melempar koin'. Dan tidak mungkin sebelum dan sesudah lemparan.

Sebagai konsekuensi lebih lanjut dari ini, apa pun yang tidak, menurut definisi, tidak mungkin adalah mungkin. Di dunia nyata, saya benci ketika pengacara bertanya "tidak mungkin Anda menandatangani dokumen ini dan melupakannya?" karena jawabannya selalu 'ya' dengan sifat pertanyaannya. Untuk itu, jawabannya juga 'ya' untuk pertanyaan "bukankah mungkin Anda diangkut melalui dematerialisasi ke planet Remulak 4 dan dipaksa untuk melakukan sesuatu kemudian diangkut kembali tanpa ingatan akan hal itu?". Kemungkinannya mungkin sangat rendah - tetapi apa yang tidak mustahil adalah mungkin. Dalam konsep probabilitas reguler kami, ketika kita berbicara tentang membalik koin, itu mungkin muncul di kepala; mungkin muncul ekor; dan bahkan mungkin berdiri di ujung atau (entah bagaimana, seperti jika kita tertidur di pesawat ruang angkasa saat dibius dan dibawa ke orbit) mengapung di udara selamanya. Tapi, sebelum atau sesudah lemparan, ekor pada saat yang sama: mereka adalah hasil yang saling eksklusif dalam ruang sampel percobaan (lihat 'ruang sampel probabilitas' dan 'sigma-aljabar').

Kedua, pada semua filosofi Bayesian / Frequentist tentang interval kepercayaan, memang benar itu berkaitan dengan frekuensi jika seseorang bertindak sebagai frequentist. Jadi, ketika kita mengatakan interval kepercayaan untuk rata-rata sampel dan estimasi adalah 95%, kita tidak mengatakan bahwa kita 95% yakin nilai 'nyata' terletak di antara batas. Kami mengatakan bahwa, jika kami dapat mengulangi percobaan ini berulang kali, 95% dari waktu kami akan menemukan bahwa rata-rata, memang, di antara batas. Ketika kita melakukannya dengan sekali jalan, bagaimanapun, kita mengambil jalan pintas mental dan mengatakan 'kita 95% yakin kita benar'.

Akhirnya, jangan lupa apa pengaturan standar pada tes hipotesis berdasarkan percobaan. Jika kita ingin tahu apakah hormon pertumbuhan tanaman membuat tanaman tumbuh lebih cepat, mungkin kita pertama-tama menentukan ukuran rata-rata tomat setelah 6 bulan pertumbuhan. Lalu kami ulangi, tetapi dengan hormon, dan dapatkan ukuran rata-rata. Hipotesis nol kami adalah 'hormon tidak bekerja', dan kami menguji bahwa . Tetapi, jika tanaman yang diuji rata-rata lebih besar, dengan kepercayaan 99%, itu berarti 'akan selalu ada variasi acak karena tanaman dan seberapa akurat kami menimbang, tetapi jumlah keacakan yang akan menjelaskan hal ini akan terjadi kurang dari satu waktu dalam seratus. "


1

Masalah ini dapat dicirikan sebagai kebingungan probabilitas sebelum dan posterior atau mungkin sebagai ketidakpuasan karena tidak mengetahui distribusi bersama variabel acak tertentu.

Pengkondisian

n1nXYXYP(X=xY=y)=1/(n(n1))x,yN:={1,,n}xyP(X=x)=1/nP(Y=x)=1/nxN

tP(X=x)=1/nxNxNX=xP(X=x|Y=t)=P(X=xY=t)/P(Y=t)xt1/(n1)x=t0X=xY=tX=xX=xY=tP(X=x)=P(Y=x)=1/nxN

Tidak mengkondisikan bukti berarti mengabaikan bukti. Namun, kita hanya dapat mengkondisikan pada apa yang dapat diungkapkan dalam model probabilistik. Dalam contoh kita dengan dua bola dari guci, kita tidak bisa mengkondisikan cuaca atau bagaimana perasaan kita hari ini. Jika kami memiliki alasan untuk percaya bahwa itu adalah bukti yang relevan dengan percobaan, kami harus mengubah model kami terlebih dahulu agar kami dapat mengekspresikan bukti ini sebagai peristiwa formal.

CC=1X<YP(C=1)=1/2tP(C=1|Y=t)=(t1)/(n1)P(C=1|Y=1)=0C=1P(C=1|Y=n)=1C=1P(C=1)=1/2

Interval Keyakinan

X=(X1,,Xn)n(l,u)γXluRnθRP(l(X)θu(X))γ

C(l,u)C=1l(X)θu(X)P(C=1)γ

x=(x1,,xn)RnxiXiiC=1δ:=P(C=1|X=x)01(C=1X=x)((l(x)θu(x))X=x)l(x)θu(x)δ=0l(x)θu(x)X=xδ=1l(x)u(x)xδ{0,1}

P(C=1)γC=1x[l(x),u(x)][l(x),u(x)]θγ, berarti mengakui bukti ini dan pada saat yang sama mengabaikannya.

Belajar Lebih Banyak, Lebih Sedikit Mengetahui

δXYxRP(X=x)P(Y=x)P(X=xY=y)x,yR(X,Y)

Y=7XP(X=x)x(x,7)xRxP(X=x)Y=7Y=77P(X=x)X=xP(X=x|Y=7)=P(X=xY=7)/P(Y=7)

YX


0

Jika saya mengatakan probabilitas skor Knicks antara xbar - 2sd (x) dan xbar + 2sd (x) adalah sekitar 0,95 dalam beberapa permainan di masa lalu, itu adalah pernyataan yang masuk akal mengingat beberapa asumsi distribusi khusus tentang distribusi skor bola basket . Jika saya mengumpulkan data tentang skor yang diberikan beberapa sampel game dan menghitung interval itu, probabilitas bahwa mereka mencetak skor dalam interval itu pada hari tertentu di masa lalu jelas nol atau satu, dan Anda dapat google hasil permainan untuk mencari tahu. Satu-satunya anggapan itu mempertahankan non-nol atau satu probabilitas untuk frequentist berasal dari pengambilan sampel berulang, dan realisasi estimasi interval sampel tertentu adalah titik ajaib di mana itu terjadi atau tidak memberikan perkiraan interval sampel itu . Itu bukan titik di mana Anda mengetikkan kata sandi,

Inilah yang dikemukakan Dikran di atas, dan saya telah memilih jawabannya. Titik ketika sampel berulang di luar pertimbangan adalah titik dalam paradigma frequentist di mana probabilitas non-diskrit menjadi tidak dapat diperoleh , bukan ketika Anda mengetikkan kata sandi seperti dalam contoh Anda di atas, atau ketika Anda google hasilnya dalam contoh saya dari Game Knicks, tetapi intinya saat jumlah sampel Anda = 1.


0

Pemodelan

S=(Ω,Σ,P)EΣP(E)ESS

Langkah (1) memungkinkan beberapa kelonggaran. Ketepatan pemodelan kadang-kadang dapat diuji dengan membandingkan probabilitas peristiwa tertentu dengan apa yang kita harapkan secara intuitif. Secara khusus, melihat probabilitas marginal atau kondisional tertentu dapat membantu untuk mendapatkan gambaran seberapa tepat pemodelannya.

X1,,XnDist(θ)θR

Estimator Interval Keyakinan

γLRRnP(L(X)θR(X))γX=(X1,,Xn)L(X)R(X)xRnL(x)θR(x)

Preferensi

γ1γ2γ1<γ2probabilitas yang lebih tinggi untuk menjadi tiket kemenangan daripada yang pertama ketika mereka ditarik. Preferensi mengenai pengamatan yang berbeda (dua tiket dalam contoh ini) berdasarkan sifat probabilistik dari proses acak yang menghasilkan pengamatan baik-baik saja. Perhatikan bahwa kami tidak mengatakan bahwa salah satu tiket memiliki probabilitas lebih tinggi untuk menjadi tiket yang menang. Jika kita pernah mengatakannya, maka dengan "probabilitas" dalam bahasa sehari-hari, yang bisa berarti apa saja, jadi sebaiknya dihindari di sini.

0.95

Contoh dengan Prioritas Sederhana

θP(θ=0)=P(θ=1)=1/2ϑRθ=ϑX1,,XnN(ϑ,1)L,RγϑRP(L(X)ϑR(X)|θ=ϑ)γP(L(X)θR(X))γ

xRn(X1,,Xn)θL(x)R(x)P(L(x)θR(x)|X=x)fμnμσ=1

P(L(x)θR(x)|X=x)={f0(x)f0(x)+f1(x)if L(x)0R(x)<1f1(x)f0(x)+f1(x)if 0<L(x)1R(x)1if L(x)0 and 1R(x)0else
γθL(X)θR(X)γ

θxx{μ0,μ1}={0,1}

P(θ=μ0|X=x)=fμ0(x)fμ0(x)+fμ1(x)

0

Jika kita bisa mengatakan "probabilitas bahwa parameter sebenarnya terletak pada interval kepercayaan ini" maka kita tidak akan memperhitungkan ukuran sampel. Tidak peduli seberapa besar sampelnya, asalkan meannya sama, maka interval kepercayaannya akan sama lebar. Tetapi ketika kita mengatakan "jika saya mengulangi ini 100 kali, maka saya akan berharap bahwa dalam 95 kasus parameter sebenarnya akan berada dalam interval", kami memperhitungkan ukuran ukuran sampel, dan seberapa yakin perkiraan kami . Semakin besar ukuran sampel, semakin sedikit varians yang akan memiliki estimasi rata-rata. Jadi itu tidak akan berubah banyak, dan ketika kita mengulangi prosedur 100 kali, kita tidak perlu interval besar untuk memastikan bahwa dalam 95 kasus parameter sebenarnya dalam interval.


Perlu diingat bahwa interval kepercayaan adalah konsep yang sering terjadi.
Michael Chernick
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.