Mengapa 95% Confidence Interval (CI) tidak menyiratkan peluang 95% mengandung mean?


228

Tampaknya melalui berbagai pertanyaan terkait di sini, terdapat konsensus bahwa bagian "95%" dari apa yang kita sebut "interval kepercayaan 95%" mengacu pada fakta bahwa jika kita harus secara tepat mereplikasi prosedur pengambilan sampel dan perhitungan CI kita berkali-kali. , 95% dari CI yang dihitung demikian akan mengandung rata-rata populasi. Tampaknya juga merupakan konsensus bahwa definisi ini tidakizinkan seseorang untuk menyimpulkan dari CI 95% tunggal bahwa ada kemungkinan 95% bahwa rerata jatuh di suatu tempat dalam CI. Namun, saya tidak mengerti bagaimana yang pertama tidak menyiratkan yang terakhir sejauh, setelah membayangkan banyak CI 95% mengandung rata-rata populasi, seharusnya tidak menjadi ketidakpastian kita (berkenaan dengan apakah CI kami yang benar-benar dihitung mengandung populasi Berarti atau tidak) memaksa kita untuk menggunakan tingkat dasar dari kasus yang dibayangkan (95%) sebagai estimasi kami tentang probabilitas bahwa kasus kami yang sebenarnya mengandung CI?

Saya telah melihat tulisan berdebat di sepanjang baris "CI yang benar-benar dihitung baik mengandung mean populasi atau tidak, jadi probabilitasnya adalah 1 atau 0", tetapi ini tampaknya menyiratkan definisi aneh tentang probabilitas yang tergantung pada negara yang tidak dikenal (yaitu seorang teman membalik koin yang adil, menyembunyikan hasilnya, dan saya dilarang mengatakan ada kemungkinan 50% bahwa itu adalah kepala).

Tentunya saya salah, tapi saya tidak melihat di mana logika saya salah ...


4
Dengan "kebetulan", maksud Anda "probabilitas" dalam pengertian teknis yang sering terjadi, atau dalam pengertian Bayesian tentang masuk akal subjektif? Dalam pengertian frequentist, hanya peristiwa eksperimen acak yang memiliki probabilitas. Melihat tiga angka (tetap) yang diberikan (nilai tengah sebenarnya, batas CI yang dihitung) untuk menentukan urutannya (nilai tengah sebenarnya yang terkandung dalam CI?) Bukanlah percobaan acak. Ini juga mengapa bagian probabilitas dari "CI yang benar-benar dihitung baik mengandung mean populasi atau tidak, jadi probabilitasnya adalah 1 atau 0" juga salah. Model probabilitas frequentist tidak berlaku dalam kasus itu.
caracal

11
Itu tergantung pada bagaimana Anda memperlakukan mean teoritis. Jika itu adalah variabel acak maka Anda dapat mengatakan tentang probabilitas bahwa ia jatuh ke dalam beberapa interval. Jika konstan, Anda tidak bisa. Itulah penjelasan paling sederhana, yang menutup masalah ini untuk saya secara pribadi.
mpiktas

2
Kebetulan, saya menemukan pembicaraan ini, dari Thaddeus Tarpey: Semua model benar ... kebanyakan tidak berguna . Dia membahas pertanyaan tentang probabilitas bahwa interval kepercayaan 95% mengandung (p. 81 dst.)? μ
chl

3
@Nesp: Saya tidak berpikir ada masalah dengan pernyataan "Ini probabilitas adalah nol atau satu" mengacu pada probabilitas (posterior) bahwa CI berisi parameter (tetap). (Ini bahkan tidak benar - benar mengandalkan interpretasi probabilitas yang sering terjadi!). Itu juga tidak mengandalkan "negara tidak dikenal". Pernyataan seperti itu merujuk tepat pada situasi di mana seseorang diberikan CI berdasarkan sampel tertentu. Ini adalah latihan matematika sederhana untuk menunjukkan bahwa probabilitas seperti itu sepele, yaitu mengambil nilai dalam . {0,1}
kardinal

3
@MikeLawrence tiga tahun kemudian, apakah Anda senang dengan definisi interval kepercayaan 95% karena ini: "jika kita berulang kali mengambil sampel dari populasi dan menghitung interval kepercayaan 95% setelah setiap sampel, 95% dari interval kepercayaan kami akan mengandung rata-rata ". Seperti Anda pada tahun 2012, saya berjuang untuk melihat bagaimana ini tidak menyiratkan bahwa interval kepercayaan 95% memiliki kemungkinan 95% untuk mengandung rerata. Saya akan tertarik untuk melihat bagaimana pemahaman Anda tentang interval kepercayaan telah berkembang sejak Anda mengajukan pertanyaan ini.
luciano

Jawaban:


107

Sebagian dari masalah adalah bahwa definisi yang sering tentang probabilitas tidak memungkinkan probabilitas nontrivial untuk diterapkan pada hasil percobaan tertentu, tetapi hanya untuk beberapa populasi percobaan fiktif dari mana eksperimen khusus ini dapat dianggap sebagai sampel. Definisi CI membingungkan karena merupakan pernyataan tentang populasi eksperimen fiktif ini (biasanya), bukan tentang data tertentu yang dikumpulkan dalam contoh yang ada. Jadi bagian dari masalah adalah salah satu definisi probabilitas: Gagasan tentang nilai sebenarnya terletak dalam interval tertentu dengan probabilitas 95% tidak konsisten dengan kerangka kerja yang sering terjadi.

Aspek lain dari masalah ini adalah bahwa perhitungan kepercayaan sering tidak menggunakan semua informasi yang terkandung dalam sampel tertentu yang relevan untuk membatasi nilai sebenarnya dari statistik. Pertanyaan saya "Apakah ada contoh di mana interval kredibel Bayesian jelas lebih rendah daripada interval kepercayaan yang sering terjadi"membahas sebuah makalah oleh Edwin Jaynes yang memiliki beberapa contoh yang sangat bagus yang benar-benar menyoroti perbedaan antara interval kepercayaan dan interval kredibel. Salah satu yang sangat relevan dengan diskusi ini adalah Contoh 5, yang membahas perbedaan antara interval kredibel dan kepercayaan untuk memperkirakan parameter distribusi eksponensial terpotong (untuk masalah dalam kontrol kualitas industri). Dalam contoh yang dia berikan, ada cukup informasi dalam sampel untuk memastikan bahwa nilai sebenarnya dari parameter tidak terletak pada interval kepercayaan 90% yang dibangun dengan benar!

Ini mungkin tampak mengejutkan bagi sebagian orang, tetapi alasan untuk hasil ini adalah bahwa interval kepercayaan dan interval yang kredibel adalah jawaban untuk dua pertanyaan yang berbeda, dari dua interpretasi probabilitas yang berbeda.

Interval kepercayaan adalah jawaban untuk permintaan: "Beri saya interval yang akan mengurung nilai sebenarnya dari parameter dalam % dari contoh percobaan yang diulang banyak kali." Interval yang kredibel adalah jawaban untuk permintaan: "Beri saya interval yang tanda kurung nilai sebenarnya dengan probabilitas p diberikan sampel tertentu yang saya benar-benar amati. " Untuk dapat menjawab permintaan yang terakhir, kita harus terlebih dahulu mengadopsi salah satu (a ) konsep baru dari proses menghasilkan data atau (b) konsep yang berbeda dari definisi probabilitas itu sendiri. 100pp

Alasan utama bahwa interval kepercayaan 95% tertentu tidak menyiratkan kemungkinan 95% untuk mengandung rerata adalah karena interval kepercayaan adalah jawaban untuk pertanyaan yang berbeda, jadi itu hanya jawaban yang tepat ketika jawaban kedua pertanyaan tersebut terjadi. memiliki solusi numerik yang sama.

Singkatnya, interval kredibel dan kepercayaan diri menjawab pertanyaan yang berbeda dari perspektif yang berbeda; keduanya bermanfaat, tetapi Anda harus memilih interval yang tepat untuk pertanyaan yang sebenarnya ingin Anda tanyakan. Jika Anda menginginkan interval yang menerima interpretasi probabilitas 95% (posterior) berisi nilai sebenarnya, maka pilih interval yang kredibel (dan, dengan itu, konseptualisasi probabilitas yang ada), bukan interval kepercayaan. Hal yang tidak boleh Anda lakukan adalah mengadopsi definisi probabilitas yang berbeda dalam interpretasi daripada yang digunakan dalam analisis.

Berkat @ cardinal untuk penyempurnaannya!

Ini adalah contoh nyata, dari buku hebat David MaKay, "Teori Informasi, Inferensi, dan Algoritma Pembelajaran" (halaman 464):

Biarkan parameter yang menarik menjadi dan data D , sepasang poin x 1 dan x 2 ditarik secara independen dari distribusi berikut:θDx1x2

p(x|θ)={1/2x=θ,1/2x=θ+1,0otherwise

Jika adalah 39 , maka kita akan mengharapkan untuk melihat dataset ( 39 , 39 ) , ( 39 , 40 ) , ( 40 , 39 ) dan ( 40 , 40 ) semua dengan sama probabilitas 1 / 4 . Pertimbangkan interval kepercayaan diriθ39(39,39)(39,40)(40,39)(40,40)1/4

.[θmin(D),θmax(D)]=[min(x1,x2),max(x1,x2)]

Jelas ini adalah interval kepercayaan 75% yang valid karena jika Anda mengambil sampel ulang data, , berkali-kali maka interval kepercayaan yang dibangun dengan cara ini akan mengandung nilai sebenarnya 75% dari waktu.D=(x1,x2)

Sekarang perhatikan data . Dalam hal ini interval kepercayaan 75% yang sering terjadi adalah [ 29 , 29 ] . Namun, dengan asumsi model proses pembangkit sudah benar, θ bisa 28 atau 29 dalam kasus ini, dan kami tidak punya alasan untuk menganggap bahwa 29 lebih mungkin dari 28, sehingga probabilitas posterior adalah p ( θ = 28 | D ) = p ( θ = 29 | D ) = 1 / 2D=(29,29)[29,29]θp(θ=28|D)=p(θ=29|D)=1/2. Jadi dalam hal ini interval kepercayaan frequentist jelas bukan interval kredibel 75% karena hanya ada kemungkinan 50% bahwa itu berisi nilai sebenarnya dari , mengingat apa yang dapat kita simpulkan tentang θ dari sampel khusus ini .θθ

Ya, ini adalah contoh yang dibuat-buat, tetapi jika interval kepercayaan dan interval yang kredibel tidak berbeda, maka mereka akan tetap identik dalam contoh yang dibuat.

Perhatikan perbedaan utama adalah bahwa interval kepercayaan adalah pernyataan tentang apa yang akan terjadi jika Anda mengulangi percobaan berkali-kali, interval yang dapat dipercaya adalah pernyataan tentang apa yang dapat disimpulkan dari sampel khusus ini.


8
Interval kepercayaan adalah jawaban untuk pertanyaan "beri saya interval yang akan mengurung nilai sebenarnya dari statistik dengan probabilitas p jika percobaan diulangi dalam jumlah besar kali". Interval kredibel adalah jawaban untuk pertanyaan "beri saya interval yang kurung nilai sebenarnya dengan probabilitas p". Pertama-tama, pernyataan berkenaan dengan interpretasi yang sering tentang kemungkinan meninggalkan sesuatu yang diinginkan. Mungkin, masalahnya terletak pada penggunaan probabilitas kata dalam kalimat itu. Kedua, saya menemukan interval "definisi" yang dapat dipercaya sedikit terlalu sederhana ...
kardinal

7
... dan sedikit menyesatkan mengingat karakterisasi yang Anda berikan kepada CI. Dalam nada yang terkait, kalimat penutup memiliki masalah yang sama: Jika Anda menginginkan interval yang berisi nilai sebenarnya 95% dari waktu, maka pilih interval yang kredibel, bukan interval kepercayaan. Penggunaan sehari-hari "mengandung nilai sebenarnya 95% dari waktu" agak tidak tepat dan meninggalkan kesan yang salah. Memang, saya dapat membuat argumen yang meyakinkan (saya percaya) bahwa kata-kata seperti itu jauh lebih dekat dengan definisi CI.
kardinal

11
Permintaan : Akan sangat membantu bagi downvoter untuk jawaban ini untuk menyatakan pendapat / alasan mereka dalam komentar. Sementara pertanyaan ini sedikit lebih mungkin daripada kebanyakan untuk mengarah pada diskusi yang panjang, masih bermanfaat untuk memberikan umpan balik yang membangun untuk penjawab; itu adalah salah satu cara termudah untuk membantu meningkatkan keseluruhan konten situs. Tepuk tangan.
kardinal

9
Dikran, ya, saya setuju. Itu adalah bagian dari apa yang saya coba untuk sedikit lebih banyak di suntingan. Seorang frequentist radikal (yang tentu saja bukan saya ) mungkin menyatakannya secara provokatif sebagai: "A CI konservatif di mana saya merancang interval sebelumnya sehingga tidak peduli apa data tertentu yang kebetulan saya amati, parameter akan ditangkap dalam interval 95% waktu. Sebuah interval yang kredibel muncul dari mengatakan 'Ups, seseorang baru saja melemparkan beberapa data di pangkuan saya. Berapa probabilitas interval yang saya buat dari data itu berisi parameter yang benar?' "Itu agak tidak adil dalam kasus yang terakhir .. .
kardinal

2
Dikran, kita semua berasal dari latar belakang yang berbeda dan itu membantu memperkaya pemahaman kita. Mengenai probabilitas dan konsep-konsep terkait, mungkin pemikir paling cemerlang yang saya senang berinteraksi dengan tidak memiliki statistik formal atau latar belakang probabilitas (matematika); dia adalah seorang insinyur.
kardinal

28

Dalam statistik frequentist, probabilitas adalah tentang peristiwa dalam jangka panjang. Mereka hanya tidak berlaku untuk satu acara setelah selesai. Dan menjalankan percobaan dan perhitungan CI hanyalah peristiwa semacam itu.

Anda ingin membandingkannya dengan kemungkinan koin tersembunyi menjadi kepala tetapi Anda tidak bisa. Anda dapat menghubungkannya dengan sesuatu yang sangat dekat. Jika permainan Anda memiliki aturan di mana Anda harus menyatakan setelah flip "kepala" maka kemungkinan Anda akan benar dalam jangka panjang adalah 50% dan itu analog.

Ketika Anda menjalankan percobaan dan mengumpulkan data, maka Anda memiliki sesuatu yang mirip dengan flip koin yang sebenarnya. Proses percobaan seperti proses membalik koin yang menghasilkan μatau tidak hanya seperti koin itu kepala atau tidak. Setelah Anda melempar koin, apakah Anda melihatnya atau tidak, tidak ada kemungkinan bahwa itu adalah kepala, itu kepala atau tidak. Sekarang anggaplah Anda memanggil kepala. Itulah yang menghitung CI. Karena Anda tidak pernah dapat mengungkapkan koin (analogi percobaan Anda akan hilang). Entah Anda benar atau salah, itu saja. Apakah kondisi saat ini ada kaitannya dengan kemungkinan muncul di flip berikutnya, atau bahwa saya bisa memprediksi apa itu? Tidak. Proses pembuatan kepala memiliki kemungkinan 0,5 menghasilkannya, tetapi itu tidak berarti bahwa kepala yang sudah ada memiliki kemungkinan 0,5 menjadi. Setelah Anda menghitung CI Anda, tidak ada kemungkinan bahwa ia menangkap μEntah berhasil atau tidak — Anda sudah membalik koin.

OK, saya pikir saya sudah cukup menyiksanya. Poin kritisnya adalah analogi Anda salah arah. Anda tidak pernah dapat mengungkapkan koin; Anda hanya dapat memanggil kepala atau ekor berdasarkan asumsi tentang koin (percobaan). Anda mungkin ingin membuat taruhan setelah itu pada kepala atau ekor Anda dengan benar tetapi Anda tidak bisa menagihnya. Juga, ini merupakan komponen penting dari prosedur CI yang Anda nyatakan nilai impor dalam interval. Jika tidak, maka Anda tidak memiliki CI (atau setidaknya tidak satu pada% yang dinyatakan).

Mungkin hal yang membuat CI membingungkan adalah namanya. Ini adalah rentang nilai yang mengandung atau tidak mengandung . Kami pikir mereka mengandung μ tetapi kemungkinan itu tidak sama dengan proses yang dikembangkan untuk mengembangkannya. Bagian 95% dari nama CI 95% hanya tentang proses. Anda dapat menghitung rentang yang Anda yakini setelah itu mengandung μ pada tingkat probabilitas tetapi itu adalah perhitungan yang berbeda dan bukan CI.μμμ

Lebih baik untuk memikirkan nama 95% CI sebagai sebutan semacam pengukuran berbagai nilai yang menurut Anda masuk akal mengandung dan pisahkan 95% dari masuk akal itu. Kita bisa menyebutnya CI Jennifer sementara CI 99% adalah Wendy CI. Itu mungkin sebenarnya lebih baik. Kemudian, setelah itu kita dapat mengatakan bahwa kita percaya μ kemungkinan berada dalam kisaran nilai dan tidak ada yang akan terjebak mengatakan bahwa ada kemungkinan Wendy bahwa kita telah menangkap μ . Jika Anda ingin penunjukan yang berbeda, saya pikir Anda mungkin harus merasa bebas untuk menyingkirkan bagian "percaya diri" dari CI juga (tetapi ini adalah interval).μμμ


Agar cukup adil, jawaban ini sepertinya tidak masalah, tetapi saya akan senang melihat deskripsi formal (matematis) untuknya. Dengan formal, maksud saya mengubahnya menjadi acara. Saya akan menjelaskan maksud saya: Saya ingat sangat bingung dengan nilai pada awalnya. Di suatu tempat saya membaca bahwa "apa nilai p sebenarnya menghitung adalah probabilitas data mengingat bahwa hipotesis nol, H 0 , adalah benar". Ketika saya mengaitkan ini dengan teorema Bayes, semuanya masuk akal sehingga sekarang saya dapat menjelaskannya kepada semua orang (yaitu bahwa seseorang menghitung p ( D | H 0 ) ). Namun, saya (ironisnya) tidak begitu percaya diri ...ppH0p(D|H0)
Néstor

... (lanjutan) dengan interval kepercayaan: apakah ada cara untuk mengungkapkan apa yang Anda katakan dalam hal pengetahuan? Dalam Frek. statistik. satu biasanya menghitung estimasi , dengan beberapa metode (misalnya, MLE). Apakah ada cara untuk menulis P ( L 1 ( μ ) < μ < L 2 ( ^ m u ) | D ) (misalnya dengan interval bayesian sentral posterior, dengan μ yang "berarti benar") sebagai fungsi dari P ( L 1 < ˉ X - μ <μ^P(L1(μ^)<μ<L2(mu^)|D)μ (yaitu, apasebenarnya interval kepercayaan α %), seperti ketika Anda dapat mengekspresikan p ( H 0 | D ) sebagai fungsi p ( D | H 0 ) ? Secara intuitif saya selalu berpikir bahwa itu bisa dilakukan, tetapi tidak pernah melakukannya. P(L1<X¯μ<L2)=ααp(H0|D)p(D|H0)
Néstor

Terkadang bisa menghapus komentar memiliki kekurangan. Saya tidak bisa mengikuti perubahan yang cepat, dalam hal ini!
kardinal

1
" Jika Anda tidak menghitung interval kepercayaan Anda, Anda memiliki sesuatu yang mirip dengan koin tersembunyi dan memiliki kemungkinan 95% mengandung mu seperti halnya koin memiliki kemungkinan 50% menjadi kepala. " - Saya pikir Anda dapat analogi yang salah di sini. "Menghitung CI" tidak sesuai dengan mengungkapkan koin, itu sesuai dengan memanggil "Kepala" atau "Ekor", di mana Anda masih memiliki peluang 50-50 untuk menjadi benar. Mengungkap koin sesuai dengan * melihat nilai populasi , pada titik mana Anda dapat menjawab pertanyaan apakah itu dalam interval "disebut". Teka-teki OP tetap ada. μ
Glen_b

1
@ Vonjd, saya tidak melihat apa yang tidak masuk akal tentang hal itu. Ini jelas kasus lawan Anda memiliki flush atau tidak. Jika yang pertama, probabilitasnya adalah (sepele) 1, & jika yang terakhir 0. Dengan demikian, Anda tidak dapat mengatakan dengan bijak kemungkinannya adalah. Itu masuk akal. Sebelum melakukan transaksi, masuk akal untuk berbicara tentang kemungkinan diberikan flush. Demikian juga, sebelum menggambar kartu, masuk akal untuk berbicara tentang kemungkinan mendapatkan jas yang Anda butuhkan. Setelah Anda memiliki kartu, itu adalah apa pun yang sesuai.
gung

22

Ide-ide formal, eksplisit tentang argumen, kesimpulan dan logika berasal, dalam tradisi Barat, dengan Aristoteles. Aristoteles menulis tentang topik ini dalam beberapa karya yang berbeda (termasuk yang disebut Topik ;-)). Namun, prinsip tunggal yang paling mendasar adalah Hukum Non-kontradiksi , yang dapat ditemukan di berbagai tempat, termasuk Metafisikabuku IV, bab 3 & 4. Formulasi tipikal adalah: "... tidak mungkin untuk apa pun pada saat yang bersamaan dan tidak [dalam arti yang sama]" (1006 a 1). Pentingnya dinyatakan sedikit lebih awal, "... ini secara alami adalah titik awal bahkan untuk semua aksioma lainnya" (1005 b 30). Maafkan saya karena melakukan waxing filosofis, tetapi pertanyaan ini pada dasarnya memiliki konten filosofis yang tidak bisa begitu saja disingkirkan untuk kenyamanan.

Pertimbangkan eksperimen pikiran ini: Alex membalik koin, menangkapnya dan membalikkannya ke lengannya dengan tangan menutupi sisi yang menghadap ke atas. Bob berdiri di posisi yang tepat; dia melihat sekilas koin di tangan Alex, dan dengan demikian dapat menyimpulkan sisi mana yang menghadap ke atas sekarang. Namun, Carlos tidak melihat koin - dia tidak di tempat yang tepat. Pada titik ini, Alex bertanya kepada mereka berapa probabilitas bahwa koin menunjukkan kepala. Carlos menyarankan bahwa probabilitasnya adalah 0,5, karena itu adalah frekuensi jangka panjang dari kepala. Bob tidak setuju, ia dengan yakin menyatakan bahwa kemungkinannya tidak lain adalah tepat 0 .

Sekarang, siapa yang benar? Tentu saja mungkin saja Bob salah mengamat dan salah (mari kita asumsikan bahwa dia tidak salah lihat). Meskipun demikian, Anda tidak dapat meyakini bahwa keduanya benar dan berpegang pada hukum non-kontradiksi. (Saya kira bahwa jika Anda tidak percaya pada hukum non-kontradiksi, Anda bisa berpikir mereka berdua benar, atau formulasi lain semacam itu.) Sekarang bayangkan kasus yang sama, tetapi tanpa kehadiran Bob, saran Carlos bisa menjadi lebih benar (eh?) tanpa Bob di sekitar, karena tidak ada yang melihat koin? Penerapan hukum non-kontradiksi tidak begitu jelas dalam kasus ini, tetapi saya pikir jelas bahwa bagian-bagian dari situasi yang tampaknya penting tetap konstan dari yang pertama ke yang terakhir. Ada banyak upaya untuk mendefinisikan probabilitas, dan di masa depan mungkin masih ada banyak lagi, tetapi definisi probabilitas sebagai fungsi dari siapa yang kebetulan berdiri dan di mana mereka diposisikan memiliki sedikit daya tarik. Bagaimanapun (menebak dengan menggunakan frasa "interval kepercayaan "), kami bekerja dalam pendekatan Frequentist, dan di dalamnya apakah ada yang tahu keadaan koin yang sebenarnya tidak relevan. Ini bukan variabel acak - itu adalah nilai yang direalisasikan dan apakah itu menunjukkan kepala, atau itu menunjukkan ekor .

Seperti yang dicatat oleh @John, keadaan koin mungkin pada awalnya tidak tampak serupa dengan pertanyaan apakah interval kepercayaan mencakup rata-rata yang sebenarnya. Namun, alih-alih koin, kita dapat memahami ini secara abstrak sebagai nilai realisasi yang diambil dari distribusi Bernoulli dengan parameter . Dalam situasi koin, p = 0,5 , sedangkan untuk CI 95%, p =, 95 . Apa yang penting untuk disadari dalam membuat koneksi adalah bahwa bagian penting dari metafora bukanlah p yang mengatur situasi, tetapi bahwa koin terbalik atau CI yang dihitung adalah nilai yang direalisasikan , bukan variabel acak. pp=.5p=.95p

Penting bagi saya untuk mencatat pada titik ini bahwa semua ini adalah kasus dalam konsepsi Frequentist tentang probabilitas. Perspektif Bayesian tidak melanggar hukum non-kontradiksi, itu hanya dimulai dari asumsi metafisik yang berbeda tentang sifat realitas (lebih khusus tentang probabilitas). Orang lain di CV jauh lebih berpengalaman dalam perspektif Bayesian daripada saya, dan mungkin mereka dapat menjelaskan mengapa asumsi di balik pertanyaan Anda tidak berlaku dalam pendekatan Bayesian, dan bahwa pada kenyataannya, mungkin ada kemungkinan 95% dari rata-rata berbaring dalam kredibilitas 95%Interval, dalam kondisi tertentu termasuk (antara lain) bahwa yang digunakan sebelumnya akurat (lihat komentar oleh @DikranMarsupial di bawah). Namun, saya pikir semua akan setuju, bahwa begitu Anda menyatakan Anda bekerja dalam pendekatan Frequentist, tidak mungkin bahwa probabilitas rata-rata sebenarnya terletak di dalam 95% CI tertentu adalah 0,95.


5
Di bawah pendekatan Bayesian itu tidak benar bahwa sebenarnya ada probabilitas 95% bahwa nilai sebenarnya terletak pada interval kredibel 95%. Akan lebih tepat untuk mengatakan bahwa dengan memberikan distribusi tertentu sebelumnya untuk nilai statistik (mewakili keadaan awal pengetahuan kami) kemudian setelah mengamati data kami memiliki distribusi posterior yang mewakili keadaan pengetahuan terkini, yang memberi kami interval di mana kami yakin 95% bahwa nilai sebenarnya terletak. Ini hanya akan akurat jika prior kami akurat (dan asumsi lain seperti bentuk kemungkinan).
Dikran Marsupial

@DikranMarsupial, terima kasih atas catatannya. Itu sedikit suap. Saya mengedit jawaban saya untuk membuatnya lebih konsisten dengan saran Anda, tetapi tidak menyalinnya di toto . Beri tahu saya jika pengeditan lebih lanjut sesuai.
gung

Pada dasarnya pendekatan Bayesian paling baik ditafsirkan sebagai pernyataan keadaan pengetahuan Anda mengenai parameter yang menarik (lihat kardinal, saya belajar; o), tetapi tidak menjamin bahwa keadaan pengetahuan itu benar kecuali semua asumsi benar. . Saya menikmati diskusi filosofis, saya harus ingat hukum non-kontradiksi untuk waktu berikutnya adalah membahas logika fuzzy; o)
Dikran Marsupial

12

Mengapa 95% CI tidak menyiratkan peluang 95% mengandung mean?

Ada banyak masalah yang harus diklarifikasi dalam pertanyaan ini dan di sebagian besar tanggapan yang diberikan. Saya akan membatasi diri hanya untuk mereka berdua.

Sebuah. Apa yang dimaksud dengan populasi? Apakah ada populasi yang benar-benar berarti?

Konsep rata-rata populasi tergantung pada model. Karena semua model salah, tetapi beberapa berguna, rerata populasi ini adalah fiksi yang didefinisikan hanya untuk memberikan interpretasi yang bermanfaat. Fiksi dimulai dengan model probabilitas.

Model probabilitas ditentukan oleh triplet mana X adalah ruang sampel (set non-kosong), F adalah keluarga himpunan bagian dari X dan P adalah ukuran probabilitas yang didefinisikan dengan baik didefinisikan lebih dari F (Ini mengatur perilaku data). Tanpa kehilangan keumuman, pertimbangkan hanya kasus diskrit. Populasi berarti didefinisikan oleh μ = Σ x X x P ( X = x ) , yaitu, itu merupakan tendensi sentral di bawah P

(X,F,P),
XFXPF
μ=xXxP(X=x),
Pdan itu juga dapat diartikan sebagai pusat massa semua titik dalam , di mana bobot masing-masing x X diberikan oleh P ( X = x ) .XxXP(X=x)

Dalam teori probabilitas, ukuran dianggap diketahui, oleh karena itu rata-rata populasi dapat diakses melalui operasi sederhana di atas. Namun, dalam praktiknya, probabilitas P hampir tidak diketahui. Tanpa probabilitas P , seseorang tidak dapat menggambarkan perilaku probabilistik data. Karena kami tidak dapat menetapkan probabilitas P yang tepat untuk menjelaskan perilaku data, kami menetapkan keluarga M yang berisi ukuran probabilitas yang mungkin mengatur (atau menjelaskan) perilaku data. Kemudian, model statistik klasik muncul ( X , F , M ) . Model di atas dikatakan sebagai model parametrik jika ada ΘPPPPM

(X,F,M).
dengan p < sehingga M{ P θ : θ q } . Mari kita perhatikan hanya model parametrik dalam posting ini.ΘRpp<M{Pθ: θΘ}

Perhatikan bahwa, untuk setiap ukuran probabilitas , ada masing-masing definisi rata-rata μPθM Artinya, ada keluarga berarti populasi { μ q : q q } yang tergantung erat pada definisi M . Keluarga M

μθ=xXxPθ(X=x).
{μθ: θΘ}MMdidefinisikan oleh manusia terbatas dan oleh karena itu mungkin tidak mengandung ukuran probabilitas sejati yang mengatur perilaku data. Sebenarnya, keluarga yang dipilih tidak akan mengandung ukuran yang sebenarnya, apalagi ukuran yang sebenarnya ini mungkin tidak ada. Karena konsep rata-rata populasi tergantung pada ukuran probabilitas dalam , rata- rata populasi tergantung pada model.M

Pendekatan Bayesian mempertimbangkan probabilitas sebelumnya atas himpunan bagian (atau, setara, Θ ), tetapi dalam posting ini saya hanya akan berkonsentrasi pada versi klasik.MΘ

b. Apa definisi dan tujuan dari interval kepercayaan?

Seperti disebutkan di atas, mean populasi tergantung pada model dan memberikan interpretasi yang bermanfaat. Namun, kami memiliki kumpulan populasi rata-rata, karena model statistik didefinisikan oleh keluarga pengukuran probabilitas (setiap pengukuran probabilitas menghasilkan mean populasi). Oleh karena itu, berdasarkan percobaan, prosedur inferensial harus digunakan untuk memperkirakan set kecil (interval) yang mengandung kandidat yang baik dari populasi rata-rata. Satu prosedur yang terkenal adalah ( ) wilayah keyakinan, yang didefinisikan oleh satu set C α sehingga, untuk semua q q , P θ ( C α ( X ) μ1αCαθΘ mana P θ ( C α ( X ) = ) = 0 (lihat Schervish, 1995). Ini adalah definisi yang sangat umum dan mencakup hampir semua interval kepercayaan. Di sini, P θ ( C α ( X )

Pθ(Cα(X)μθ)1α   and   infθΘPθ(Cα(X)μθ)=1α,
Pθ(Cα(X)=)=0 adalah probabilitas bahwa C α ( X ) mengandung μ θ di bawah ukuran P θ . Probabilitas ini harus selalu lebih besar dari (atau sama dengan) 1 - α , kesetaraan terjadi pada kasus terburuk.Pθ(Cα(X)μθ)Cα(X)μθPθ1α

M

Di satu sisi, sebelum mengamati data,Cα(X)Cα(X)μθ(1α)θΘ

xCα(x)Cα(x)μθθΘ

Yaitu, setelah mengamati dataxCα(x)(1α)100%μθθΘ

PS: Saya mengundang komentar, ulasan, kritik, atau bahkan keberatan dengan posting saya. Mari kita bahas secara mendalam. Karena saya bukan penutur asli bahasa Inggris, tulisan saya pasti mengandung kesalahan ketik dan kesalahan tata bahasa.

Referensi:

Schervish, M. (1995), Teori Statistik, ed Kedua, Springer.


Adakah yang mau membahasnya?
Alexandre Patriota

4
Diskusi dapat terjadi dalam obrolan, tetapi tidak pantas di situs utama kami. Silakan lihat pusat bantuan kami untuk informasi lebih lanjut tentang cara kerjanya. Sementara itu, saya bingung dengan pemformatan pos Anda: hampir semuanya diformat sebagai kutipan. Sudahkah Anda mengekstraksi bahan ini dari beberapa sumber yang diterbitkan atau apakah Anda sendiri, baru menulis untuk jawaban ini? Jika ini yang terakhir, silakan hapus kutipan!
whuber

2
(+1). Terima kasih atas sinopsis yang sangat jelas. Selamat datang di situs kami!
whuber

11

Saya terkejut bahwa tidak ada yang mengemukakan contoh Berger tentang interval kepercayaan 75% yang pada dasarnya tidak berguna yang dijelaskan dalam bab kedua "The Likelihood Principle". Rinciannya dapat ditemukan dalam teks asli (yang tersedia secara gratis di Project Euclid ): apa yang penting tentang contoh ini adalah bahwa ia menggambarkan, dengan jelas, situasi di mana Anda tahu dengan kepastian absolut nilai parameter yang tampaknya tidak diketahui setelah mengamati data, tetapi Anda akan menyatakan bahwa Anda hanya memiliki kepercayaan diri 75% bahwa interval Anda mengandung nilai sebenarnya. Bekerja melalui rincian contoh itu adalah apa yang memungkinkan saya untuk memahami seluruh logika membangun interval kepercayaan.


8
Dalam pengaturan yang sering, seseorang tidak akan "menegaskan bahwa Anda hanya memiliki kepercayaan diri 75% bahwa interval Anda berisi nilai sebenarnya" dalam referensi ke CI, di tempat pertama. Di sinilah letak masalahnya. :)
kardinal

1
dapatkah Anda memberikan referensi tautan / halaman langsung ke contoh itu? Saya mencari bab tetapi saya tidak dapat mengidentifikasi contoh yang benar.
Ronald

@Ronald: Ini yang pertama di halaman pertama Bab 2. Tautan langsung akan menjadi tambahan sambutan.
kardinal

1
Tautkan seperti yang diminta. Ah iya. Dalam contoh ini, tampak jelas: jika kita melakukan percobaan, ada kemungkinan 75% bahwa Interval Keyakinan yang dihasilkan akan mengandung rata-rata. Setelah kami melakukan percobaan dan kami tahu bagaimana hasilnya, kemungkinan itu mungkin berbeda, tergantung pada distribusi sampel yang dihasilkan.
Ronald

7

Saya tidak tahu apakah ini harus ditanyakan sebagai pertanyaan baru, tetapi ini menjawab pertanyaan yang sama yang diajukan di atas dengan mengajukan eksperimen pemikiran.

Pertama, saya akan berasumsi bahwa jika saya memilih kartu bermain secara acak dari dek standar, kemungkinan saya memilih klub (tanpa melihatnya) adalah 13/52 = 25%.

Dan kedua, telah dinyatakan berkali-kali bahwa interval kepercayaan 95% harus ditafsirkan dalam hal mengulangi percobaan beberapa kali dan interval yang dihitung akan mengandung rata-rata sebenarnya 95% dari waktu - saya pikir ini ditunjukkan dengan cukup meyakinkan oleh James Waters simulasi. Kebanyakan orang tampaknya menerima interpretasi CI 95% ini.

Sekarang, untuk eksperimen pemikiran. Mari kita asumsikan bahwa kita memiliki variabel yang terdistribusi normal dalam populasi besar - mungkin ketinggian pria atau wanita dewasa. Saya memiliki asisten yang tak kenal lelah dan tak kenal lelah yang saya tugaskan untuk melakukan beberapa proses pengambilan sampel dengan ukuran sampel tertentu dari populasi dan menghitung mean sampel dan interval kepercayaan 95% untuk setiap sampel. Asisten saya sangat tertarik dan berhasil mengukur semua sampel yang mungkin dari populasi. Kemudian, untuk setiap sampel, asisten saya mencatat interval kepercayaan yang dihasilkan sebagai hijau (jika CI berisi mean sebenarnya) atau merah (jika CI tidak mengandung mean sebenarnya). Sayangnya, asisten saya tidak akan menunjukkan kepada saya hasil eksperimennya. Saya perlu mendapatkan beberapa informasi tentang ketinggian orang dewasa dalam populasi tetapi saya hanya punya waktu, sumber daya dan kesabaran untuk melakukan percobaan sekali. Saya membuat sampel acak tunggal (dengan ukuran sampel yang sama yang digunakan oleh asisten saya) dan menghitung interval kepercayaan (menggunakan persamaan yang sama).

Saya tidak memiliki cara untuk melihat hasil asisten saya. Jadi, berapa probabilitas bahwa sampel acak yang saya pilih akan menghasilkan CI hijau (yaitu interval berisi mean sebenarnya)?

Dalam pikiran saya, ini sama dengan situasi kartu yang diuraikan sebelumnya dan dapat diartikan sebagai probabilitas 95% bahwa interval yang dihitung berisi mean yang sebenarnya (yaitu hijau). Namun, kesimpulannya adalah bahwa interval kepercayaan 95% TIDAK dapat diartikan karena ada kemungkinan 95% bahwa interval tersebut mengandung rata-rata yang sebenarnya. Mengapa (dan di mana) alasan saya dalam eksperimen pemikiran di atas berantakan?


+1 Ini adalah akun yang sangat jelas tentang perkembangan konseptual dari populasi normal ke situasi pengambilan sampel biner. Terima kasih telah berbagi dengan kami, dan selamat datang di situs kami!
whuber

Silakan kirim ini sebagai pertanyaan.
John

Terima kasih atas komentarnya, John. Sekarang telah diposting sebagai pertanyaan terpisah ( stats.stackexchange.com/questions/301478/… ).
user1718097

4

θ(X1,X2,,Xn)100p%

P(g(X1,X2,,Xn)<θ<f(X1,X2,,Xn))=p

θg(X1,X2,,Xn)f(X1,X2,,Xn)(g(X1,X2,,Xn),f(X1,X2,,Xn)) .

Jadi alih-alih memberikan informasi tentang probabilitas parameter yang terkandung dalam interval, itu memberikan informasi tentang probabilitas interval yang berisi parameter - karena interval dibuat dari variabel acak.


3

Untuk tujuan praktis, Anda tidak salah lagi untuk bertaruh bahwa 95% CI Anda memasukkan rata-rata sebenarnya pada odds 95: 5, daripada Anda bertaruh pada flip koin teman Anda pada odds 50:50.

Jika teman Anda sudah membalik koin, dan Anda berpikir ada kemungkinan 50% untuk menjadi kepala, maka Anda hanya menggunakan definisi kata probabilitas yang berbeda. Seperti yang orang lain katakan, untuk sering kali Anda tidak dapat menetapkan probabilitas untuk suatu peristiwa yang telah terjadi, tetapi Anda dapat menggambarkan probabilitas suatu peristiwa yang terjadi di masa depan menggunakan proses yang diberikan.

Dari blog lain: frequentist akan mengatakan: "Peristiwa tertentu tidak dapat memiliki probabilitas. Koin menunjukkan kepala atau ekor, dan kecuali Anda menunjukkannya, saya tidak bisa mengatakan apa faktanya. Hanya jika Anda akan mengulangi undian banyak, berkali-kali, apa pun jika Anda memvariasikan kondisi awal lemparan cukup kuat, saya berharap bahwa frekuensi relatif kepala dalam semua lemparan banyak akan mendekati 0,5 ". http://www.researchgate.net/post/What_is_the_difference_between_frequentist_and_bayesian_probability


2
Blog itu terdengar seperti argumen orang bodoh. Tampaknya membingungkan filosofi probabilitas dengan beberapa jenis (tidak ada) keterbatasan yang melekat dalam kapasitas untuk membuat model probabilitas. Saya tidak mengenali segala bentuk prosedur statistik klasik atau metodologi dalam karakterisasi itu. Namun demikian, saya pikir kesimpulan akhir Anda adalah yang baik - tetapi bahasa yang digunakannya, dengan tidak menjelaskan bahwa taruhan itu menyangkut CI dan bukan berarti, berisiko menimbulkan bentuk kebingungan yang ingin ditangani oleh pertanyaan ini.
whuber

1
Salah satu cara yang saya lihat sering digunakan adalah untuk menekankan bahwa CI adalah hasil dari suatu prosedur. Yang saya sukai dari pernyataan akhir Anda adalah bahwa hal itu dapat segera disusun kembali dalam bentuk seperti itu, seperti dalam "Anda tidak lagi salah untuk bertaruh pada peluang 95: 5 bahwa interval kepercayaan 95% Anda telah mencakup rata-rata yang sebenarnya, daripada Anda untuk bertaruh pada flip koin teman Anda dengan odds 50:50. "
whuber

OK, ubahlah.
nigelhenry

2

Katakan bahwa CI yang Anda hitung dari kumpulan data tertentu yang Anda miliki adalah salah satu dari 5% dari CI yang mungkin tidak mengandung rerata. Seberapa dekat dengan menjadi interval kredibel 95% yang ingin Anda bayangkan? (Yaitu, seberapa dekat dengan mengandung mean dengan probabilitas 95%?) Anda tidak punya jaminan bahwa itu hampir sama sekali. Bahkan, CI Anda mungkin tidak tumpang tindih dengan bahkan satu pun dari 95% dari 95% CI yang benar-benar mengandung rerata. Belum lagi itu tidak mengandung mean itu sendiri, yang juga menunjukkan itu bukan interval kredibel 95%.

Mungkin Anda ingin mengabaikan ini dan secara optimis menganggap bahwa CI Anda adalah salah satu dari 95% yang mengandung mean. Oke, apa yang kami ketahui tentang CI Anda, mengingat CI-nya 95%? Bahwa itu mengandung mean, tetapi mungkin hanya jalan keluar pada ekstrem, tidak termasuk segala sesuatu yang lain di sisi lain mean. Tidak mungkin mengandung 95% dari distribusi.

Either way, tidak ada jaminan, bahkan mungkin tidak ada harapan yang masuk akal bahwa 95% CI Anda adalah interval yang kredibel 95%.


Saya ingin tahu tentang paragraf pertama. Mungkin saya salah membaca, tetapi argumen itu tampaknya sedikit bertentangan dengan fakta bahwa ada banyak contoh di mana CI dan interval yang kredibel bertepatan untuk semua set pengamatan yang mungkin. Apa yang saya lewatkan?
kardinal

@ kardinal: Saya mungkin salah. Saya berbicara kasus umum, tetapi dugaan saya adalah bahwa dalam kasus di mana CI dan interval yang kredibel sama, ada pembatasan lain seperti normalitas yang menjaga CI dari menjadi terlalu jauh.
Wayne

Fokus saya ditarik paling kuat ke kalimat terakhir dalam paragraf; contoh interval bertepatan dimaksudkan untuk menyoroti suatu poin. Anda mungkin mempertimbangkan apakah Anda benar-benar percaya pada kalimat itu atau tidak. :)
kardinal

Apakah maksud Anda bahwa 95% CI tidak menyiratkan bahwa 5% tidak termasuk rata-rata? Saya harus mengatakan "secara definisi, apakah tidak perlu mengandung maksud itu sendiri"? Atau apakah saya kehilangan lebih banyak lagi?
Wayne

Wayne, bagaimana fakta bahwa interval tertentu tidak mengandung mean menghalangi itu menjadi interval kredibel yang valid? Apakah saya salah membaca pernyataan ini?
kardinal

2

(Yaitu seorang teman membalik koin yang adil, menyembunyikan hasilnya, dan saya dilarang mengatakan ada kemungkinan 50% bahwa itu adalah kepala)

Jika Anda hanya menebak koin teman Anda terbalik dengan 50% kepala / ekor, maka Anda tidak melakukannya dengan benar.

  • Anda harus mencoba melihat koin dengan cepat setelah / ketika koin itu jatuh dan sebelum hasilnya disembunyikan.
  • Anda juga harus mencoba membuat beberapa perkiraan terlebih dahulu tentang kewajaran koin.

Tentunya kredibilitas tebakan Anda tentang flip koin akan tergantung pada kondisi ini dan tidak selalu 50% sama (kadang-kadang metode 'kecurangan' Anda bekerja lebih baik).

Tebakan Anda secara keseluruhan mungkin, jika Anda curang, x> 50% dari waktu yang tepat, tetapi itu tidak selalu berarti bahwa probabilitas untuk setiap lemparan tertentu secara konstan x% kepala. Jadi akan sedikit aneh untuk memproyeksikan probabilitas keseluruhan Anda ke probabilitas untuk lemparan tertentu. Ini adalah 'jenis probabilitas' yang berbeda.


Ini sedikit tentang ke tingkat atau kedalaman apa yang Anda tentukan / tentukan 'probabilitas' .

  • Keyakinan tersebut tidak tergantung dari 'probabilitas spesifik dalam eksperimen / flip tertentu' dan independen dari 'probabilitas a priori' .

  • Kepercayaan diri adalah tentang ansambel eksperimen . Ini dibangun sedemikian rupa sehingga Anda tidak perlu tahu probabilitas atau distribusi a-priori dalam populasi.

  • Kepercayaan adalah tentang 'tingkat kegagalan' keseluruhan dari estimasi tetapi untuk kasus-kasus tertentu seseorang mungkin dapat menentukan variasi probabilitas yang lebih tepat .

    ( Variasi dalam probabilitas ini setidaknya ada secara implisit , dalam teori, dan kita tidak perlu mengetahuinya agar ada. Tetapi kita dapat secara eksplisit mengungkapkan probabilitas ini dengan menggunakan pendekatan Bayesian).


Contoh 1:

p=0.99p=0.01

p0.05p10p0.95

Jika Anda memiliki 1% populasi yang sakit, maka rata-rata Anda akan mendapatkan 1,98% dari hasil tes positif (1% dari 99% orang sehat tes positif dan 99% dari 1% orang sakit tes positif). Ini membuat interval CI 95% Anda, (bersyarat) ketika Anda menemukan tes positif , hanya memperbaiki 50% dari waktu.

p

Contoh 2:

iN(μi,σi2)μsaya

μsayaN(100,15)

(Sebaliknya berlaku untuk orang yang memiliki hasil mendekati 100, IQ mereka mungkin akan lebih mungkin dari 95% di dalam 95% -CI, dan ini harus mengkompensasi kesalahan yang Anda buat pada ekstrem sehingga Anda akhirnya menjadi benar dalam 95% kasus)


2

Pertama, mari kita berikan definisi interval kepercayaan, atau, dalam ruang dimensi lebih besar dari satu, wilayah kepercayaan. Definisi ini adalah versi ringkas dari yang diberikan oleh Jerzy Neyman dalam makalahnya tahun 1937 kepada Royal Society.

halshalSEBUAH(hal,α)halrHaib(sSEBUAH(hal,α)|hal=hal,saya)=ααsayahals=sC(s,α)={hal|sSEBUAH(hal,α)}

α

Sekarang pertimbangkan untuk setiap nilai parameter yang mungkin hal

[halC(s,α)]halrHaib(s=s|hal=hal,saya)ds=[sSEBUAH(hal,α)]halrHaib(s=s|hal=hal,saya)ds=α

di mana kurung kotak adalah kurung Iverson. Ini adalah hasil utama untuk interval kepercayaan atau wilayah. Dikatakan bahwa harapan[halC(s,α)]halαhalhalhal

s=s

halrHaib(halC(s,α)|s=s,saya)=C(s,α)halrHaib(s=s|hal=hal,saya)halrHaib(hal=hal|saya)dhalhalrHaib(s=s|hal=hal,saya)halrHaib(hal=hal|saya)dhal

αsayaSEBUAH(hal,α)shalhal sebagai mean), maka:

prob(pC(s,α)|s=s,I)=C(s,α)prob(s=p|p=s,I)dpprob(s=p|p=s,I)dp=prob(sC(s,α)|p=s,I)=prob(sA(s,α)|p=s,I)

Jika selain itu daerah penerimaan adalah seperti itu sA(s,α)sA(s,α)

halrHaib(halC(s,α)|s=s,saya)=halrHaib(sSEBUAH(s,α)|hal=s,saya)=α

Contoh buku teks untuk memperkirakan mean populasi dengan interval kepercayaan standar yang dibuat tentang statistik normal adalah kasus khusus dari asumsi sebelumnya. Oleh karena itu standar 95% interval kepercayaan tidak mengandung berarti dengan probabilitas 0,95; tetapi korespondensi ini umumnya tidak berlaku.


-1

Ada beberapa jawaban menarik di sini, tetapi saya pikir saya akan menambahkan sedikit demonstrasi langsung menggunakan R. Kami baru-baru ini menggunakan kode ini dalam kursus statistik untuk menyoroti bagaimana interval kepercayaan bekerja. Inilah yang kode lakukan:

1 - Ini sampel dari distribusi yang dikenal (n = 1000)

2 - Ini menghitung 95% CI untuk rata-rata setiap sampel

3 - Bertanya apakah CI sampel masing-masing termasuk rata-rata yang sebenarnya.

4 - Ini melaporkan di konsol fraksi CI yang termasuk mean sebenarnya.

Saya baru saja menjalankan skrip beberapa kali dan sebenarnya tidak terlalu jarang menemukan bahwa kurang dari 94% CI mengandung rata-rata yang sebenarnya. Setidaknya bagi saya, ini membantu menghilangkan gagasan bahwa interval kepercayaan memiliki kemungkinan 95% berisi parameter sebenarnya.

#   In the following code, we simulate the process of
#   sampling from a distribution and calculating
#   a confidence interval for the mean of that 
#   distribution.  How often do the confidence
#   intervals actually include the mean? Let's see!
#
#   You can change the number of replicates in the
#   first line to change the number of times the 
#   loop is run (and the number of confidence intervals
#   that you simulate).
#
#   The results from each simulation are saved to a
#   data frame.  In the data frame, each row represents
#   the results from one simulation or replicate of the 
#   loop.  There are three columns in the data frame, 
#   one which lists the lower confidence limits, one with
#   the higher confidence limits, and a third column, which
#   I called "Valid" which is either TRUE or FALSE
#   depending on whether or not that simulated confidence
#   interval includes the true mean of the distribution.
#
#   To see the results of the simulation, run the whole
#   code at once, from "start" to "finish" and look in the
#   console to find the answer to the question.    

#   "start"

replicates <- 1000

conf.int.low <- rep(NA, replicates)
conf.int.high <- rep(NA, replicates)
conf.int.check <- rep(NA, replicates)

for (i in 1:replicates) {

        n <- 10
        mu <- 70
        variance <- 25
        sigma <- sqrt(variance)
        sample <- rnorm(n, mu, sigma)
        se.mean <- sigma/sqrt(n)
        sample.avg <- mean(sample)
        prob <- 0.95
        alpha <- 1-prob
        q.alpha <- qnorm(1-alpha/2)
        low.95 <- sample.avg - q.alpha*se.mean
        high.95 <- sample.avg + q.alpha*se.mean

        conf.int.low[i] <- low.95
        conf.int.high[i] <- high.95
        conf.int.check[i] <- low.95 < mu & mu < high.95
 }    

# Collect the intervals in a data frame
ci.dataframe <- data.frame(
        LowerCI=conf.int.low,
        UpperCI=conf.int.high, 
        Valid=conf.int.check
        )

# Take a peak at the top of the data frame
head(ci.dataframe)

# What fraction of the intervals included the true mean?
ci.fraction <- length(which(conf.int.check, useNames=TRUE))/replicates
ci.fraction

    #   "finish"

Semoga ini membantu!


2
Permintaan maaf untuk kritik, tetapi saya harus (sementara) menurunkan jawaban ini. Saya percaya itu salah paham arti interval kepercayaan diri dan saya sangat berharap ini bukan argumen yang digunakan di kelas Anda. Simulasi dikurangi menjadi percobaan pengambilan sampel binomial (cukup rumit).
kardinal

5
@ cardinal Yah ... dia hanya menggunakan interpretasi statistik frequentist jangka panjang. Sampel dari populasi berkali-kali, hitung CI yang berkali-kali dan Anda menemukan bahwa mean sebenarnya terkandung dalam CI 95% dari waktu (untuk1-α=0,95). Setidaknya itu cukup jelas bagiku.
Néstor

4
"Kurang dari 94%" dalam sampel 1000 CI tentu bukan bukti yang signifikan terhadap gagasan bahwa 95% CI mengandung mean. Bahkan, saya harapkan 95% CI memang mengandung mean, dalam hal ini.
Ronald

3
@Ronald: Ya, ini adalah persis poin saya dengan komentar, tapi Anda mengatakan itu jauh lebih sederhana dan ringkas. Terima kasih. Seperti yang tercantum dalam salah satu komentar, satu akan melihat 940 keberhasilan atau kurang tentang 8,7% dari waktu dan itu benar dari setiap tepatnya 95% CI bahwa salah satu konstruksi selama 1000 percobaan. :)
kardinal

2
@ JamesWaters: Terima kasih telah meluangkan waktu untuk merespons. Kode ini baik-baik saja, tetapi saya tidak melihat bagaimana "menunjukkan contoh yang salah". Bisakah Anda menjelaskan maksud itu? Saya masih curiga mungkin ada kesalahpahaman mendasar di sini. Anda tampaknya memahami apa I CI itu dan bagaimana menafsirkannya dengan benar, tetapi percobaan simulasi tidak menanggapi pertanyaan yang tampaknya Anda jawab sebagai jawabannya. Saya pikir jawaban ini memiliki potensi, jadi saya ingin melihatnya berakhir dengan suntingan yang bagus untuk memperjelas poin yang ingin Anda sampaikan. Tepuk tangan. :)
kardinal
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.