Apa yang dikatakan interval kepercayaan tentang presisi (jika ada)?

31

Morey et al (2015) berpendapat bahwa interval kepercayaan menyesatkan dan ada beberapa bias terkait dengan pemahaman mereka. Antara lain, mereka menggambarkan kekeliruan presisi sebagai berikut:

Kesalahan Presisi
Lebar interval kepercayaan menunjukkan ketepatan pengetahuan kita tentang parameter. Interval kepercayaan sempit menunjukkan pengetahuan yang tepat, sementara kesalahan kepercayaan yang luas menunjukkan pengetahuan yang tidak tepat.

Tidak ada hubungan yang diperlukan antara ketepatan estimasi dan ukuran interval kepercayaan. Salah satu cara untuk melihat ini adalah dengan membayangkan dua peneliti - seorang peneliti senior dan seorang mahasiswa PhD - sedang menganalisis data dari peserta dari percobaan. Sebagai latihan untuk keuntungan mahasiswa PhD, peneliti senior memutuskan untuk secara acak membagi peserta menjadi dua set sehingga masing-masing dapat secara terpisah menganalisis setengah dari set data. Dalam pertemuan berikutnya, kedua berbagi dengan satu sama lain Student mereka interval kepercayaan untuk mean. CI mahasiswa PhD adalah , dan CI peneliti senior . $50$ $25$ $t$ $95\%$ $52 \pm 2$ $95\%$ $53 \pm 4$

Peneliti senior mencatat bahwa hasil mereka konsisten secara luas, dan bahwa mereka dapat menggunakan rata-rata tertimbang rata-rata dari dua estimasi poin masing-masing, $52.5$ , sebagai perkiraan keseluruhan dari rata-rata sebenarnya.

Mahasiswa PhD, bagaimanapun, berpendapat bahwa dua cara mereka tidak boleh ditimbang secara merata: ia mencatat bahwa CI-nya setengah lebar dan berpendapat bahwa perkiraannya lebih tepat dan karenanya harus ditimbang lebih berat. Penasihatnya mencatat bahwa ini tidak mungkin benar, karena estimasi dari pembobotan dua cara yang tidak rata akan berbeda dari perkiraan dari menganalisis set data lengkap, yang harus $52.5$ . Kesalahan mahasiswa PhD adalah mengasumsikan bahwa CI secara langsung menunjukkan ketepatan pasca data.

Contoh di atas tampaknya menyesatkan. Jika kita secara acak membagi sampel menjadi dua, menjadi dua sampel, maka kita akan mengharapkan rata-rata sampel dan kesalahan standar menjadi dekat. Dalam kasus seperti itu seharusnya tidak ada perbedaan antara menggunakan rata-rata tertimbang (misalnya ditimbang dengan kesalahan terbalik) dan menggunakan rata-rata aritmatika sederhana. Namun jika perkiraan berbeda dan kesalahan dalam salah satu sampel terasa lebih besar, ini dapat menyarankan "masalah" dengan sampel tersebut.

Jelas, dalam contoh di atas, ukuran sampel sama sehingga "menyatukan kembali" data dengan mengambil rata-rata berarti sama dengan mengambil rata-rata seluruh sampel. Masalahnya adalah bahwa seluruh contoh mengikuti logika yang tidak jelas bahwa sampel pertama-tama dibagi menjadi beberapa bagian, kemudian digabungkan kembali untuk perkiraan akhir.

Contohnya dapat diutarakan kembali untuk mengarah pada kesimpulan sebaliknya:

Peneliti dan siswa memutuskan untuk membagi dataset mereka menjadi dua bagian dan menganalisisnya secara terpisah. Setelah itu, mereka membandingkan perkiraan mereka dan tampak bahwa sampel berarti bahwa mereka menghitung sangat berbeda, apalagi kesalahan standar estimasi siswa jauh lebih besar. Siswa takut bahwa ini dapat menyarankan masalah dengan ketepatan perkiraannya, tetapi peneliti menyiratkan bahwa tidak ada hubungan antara interval kepercayaan dan ketepatan, sehingga kedua perkiraan sama-sama dapat dipercaya dan mereka dapat menerbitkan salah satu dari mereka, dipilih secara acak, sebagai estimasi akhir mereka.

Menyatakannya secara lebih formal, interval kepercayaan "standar", seperti Student , didasarkan pada kesalahan $t$

\bar{x} \pm c \times S E (x)

$\bar x \pm c \times \mathrm{SE}(x)$

di mana adalah konstanta. Dalam kasus seperti itu, mereka berhubungan langsung dengan presisi, bukan ..? $c$

Jadi pertanyaan saya adalah:
Apakah kekeliruan presisi benar-benar kekeliruan? Apa yang dikatakan interval kepercayaan tentang presisi?

Morey, R., Hoekstra, R., Rouder, J., Lee, M., & Wagenmakers, E.-J. (2015). Kesalahan menempatkan kepercayaan dalam interval kepercayaan. Buletin & Ulasan Psikonomis, 1–21. https://learnbayes.org/papers/confidenceIntervalsFallacy/

— Tim
sumber

2

Saya kira jika presisi didefinisikan sebagai kebalikan dari varians, maka lebar CI ini hanya mencerminkan perkiraan presisi. Sebanyak lebar interval kredibel Bayesian untuk mean akan mencerminkan ketidakpastian tentang presisi.

— Scortchi

@ Scortchi maka ini adalah cara lain untuk mengatakan bahwa metode yang sering tidak dapat diandalkan secara umum ..?

— Tim

7

Saya akan mengatakan ini adalah herring merah. Saya baru saja mensimulasikan 10.000 percobaan, di masing-masing menggambar 50 sampel dari distribusi normal dengan rata-rata 52,5 dan SD 7,5 (sehingga SE dari subsampel ukuran 25 kira-kira , menghasilkan CI dari ). Saya kemudian membagi sampel ini menjadi dua dan memeriksa seberapa sering CI berbeda 2 atau lebih. Ini terjadi hanya dalam 6 dari 10.000 kasus. Siapa pun yang mengamati CI yang berbeda ini akan lebih baik curiga ada sesuatu yang rusak dalam pemilihan subsampel.

7.5 / \sqrt{25} = 5

$7.5/\sqrt{25}=5$

\pm 3

$\pm 3$

— S. Kolassa - Pasang kembali Monica

@StephanKolassa Saya melakukan simulasi yang sama persis yang mengarah pada kesimpulan yang persis sama - ini adalah bagaimana pertanyaan muncul :)

— Tim

2

@ Tim: Saya tidak benar-benar tahu apa yang mereka coba dapatkan: jika ketepatan sebenarnya dari estimasi rata-rata dipahami sebagai fungsi dari nilai parameter yang tidak diketahui, umum untuk dua sub-sampel, maka saya jangan berpikir siapa pun akan keberatan mengakui bahwa perbedaan lebar kedua CI ini karena itu tidak mencerminkan perbedaan dalam ketepatan estimasi (kecuali mereka meragukan prosedur subsampling). Mempertimbangkan sifat cakupan CI yang tergantung pada koefisien variasi yang diamati mungkin merupakan taktik yang lebih baik.

— Scortchi

16

Dalam makalah ini, kami benar-benar menunjukkan kesalahan presisi dalam berbagai cara. Yang Anda tanyakan - yang pertama di koran - Contoh ini dimaksudkan untuk menunjukkan bahwa "CI = presisi" sederhana salah. Ini bukan untuk mengatakan bahwa frequentist kompeten, Bayesian, atau likelihoodist akan bingung dengan ini.

Berikut cara lain untuk melihat apa yang terjadi: Jika kami hanya diberi tahu CI, kami masih tidak dapat menggabungkan informasi dalam sampel bersama-sama; kita perlu mengetahui , dan dari situ kita bisa menguraikan CI menjadi dan , dan dengan demikian menggabungkan kedua sampel dengan benar. Alasan kita harus melakukan ini adalah bahwa informasi dalam CI bersifat marjinal di atas parameter gangguan. Kita harus memperhitungkan bahwa kedua sampel mengandung informasi tentang parameter gangguan yang sama . Ini melibatkan komputasi nilai kedua , menggabungkan mereka untuk mendapatkan estimasi keseluruhan , kemudian menghitung CI baru. $N$ $\bar{x}$ $s^2$ $s^2$ $\sigma^2$

Adapun demonstrasi ketepatan presisi lainnya, lihat

beberapa CI di bagian Welch (1939) (kapal selam), salah satunya termasuk CI "sepele" yang disebutkan oleh @dsaxton di atas. Dalam contoh ini, CI optimal tidak melacak lebar kemungkinan, dan ada beberapa contoh CI lain yang tidak.
Fakta bahwa CI - bahkan CI "baik" dapat kosong, "salah" yang menunjukkan ketepatan tak terbatas

Jawaban atas teka-teki ini adalah "presisi", setidaknya dalam cara advokat CI memikirkannya (penilaian pasca-eksperimental tentang seberapa "dekat" suatu estimasi terhadap suatu parameter) sama sekali bukan karakteristik yang dimiliki interval kepercayaan secara umum. , dan mereka tidak dimaksudkan untuk itu. Prosedur kepercayaan khusus mungkin ... atau tidak.

Lihat juga diskusi di sini: http://andrewgelman.com/2011/08/25/why_it_doesnt_m/#comment-61591

— richarddmorey
sumber

7

(+1) Senang mendengar dari penulis yang sebenarnya! Saya setuju bahwa CI memiliki beberapa masalah filosofis, seperti halnya SEMUA bentuk inferensi (hanya masalah yang berbeda ) ... Saya suka bagaimana Anda menunjukkan bahwa itu adalah prosedur kepercayaan khusus yang perlu Anda pertimbangkan, bukan hanya itu adalah CI pada dan tingkat seperti itu.

4

(+1) Terima kasih atas tanggapan Anda! Saya setuju dengan argumen bahwa Anda menyatakan dalam makalah Anda bahwa CI tidak perlu mengatakan apa-apa tentang ketepatan, namun menyebut ini kesalahan memberikan kesan bahwa Anda menunjukkan bahwa mereka tidak mengatakan apa-apa tentang ketepatan - dan ini tidak sama ... Selain itu: menurut Anda, apakah "kekeliruan presisi" masalah analisis kehidupan nyata ..? Saya setuju bahwa salah mengartikan CI adalah, tetapi dalam kasus ini, saya tidak begitu yakin ...

— Tim

2

Dampak "Kehidupan nyata" sulit untuk dikuantifikasi, terutama yang dapat berbicara tentang dampak dalam skenario analisis tertentu atau lintas bidang. Untuk hanya menghitung CI pada Gaussian berarti kesalahan tidak terlalu berbahaya. Tetapi pertimbangkan daftar kutipan pada hal.117 (para. Mulai "Seberapa sering prosedur kepercayaan diri Steiger ..."). Interval dalam makalah yang diterbitkan cenderung "terlalu" sempit. Kekeliruan memiliki dampak lain: kurangnya ketelitian pada generator prosedur CI baru (periksa kertas dengan CI baru), keengganan analis untuk menjauh dari asumsi Gaussian saat diperlukan, dan lain-lain.

— richarddmorey

Saya tergoda oleh paranthes ini. Apa ini "kapal selam"?

— Biasa

1

θ

$\theta$

13

Pertama-tama, mari batasi diri kita pada prosedur CI yang hanya menghasilkan interval dengan lebar benar-benar positif terbatas (untuk menghindari kasus patologis).

Dalam hal ini, hubungan antara presisi dan lebar CI dapat ditunjukkan secara teoritis. Ambil taksiran untuk rata-rata (bila ada). Jika CI Anda untuk rata-rata sangat sempit, maka Anda memiliki dua interpretasi: apakah Anda memiliki nasib buruk dan sampel Anda terlalu padat (peluang priori 5% dari hal itu terjadi), atau interval Anda mencakup rata-rata yang sebenarnya (95% kesempatan a priori). Tentu saja, CI yang diamati dapat merupakan salah satu dari dua ini, tetapi , kami menyiapkan perhitungan kami sehingga yang terakhir jauh lebih mungkin terjadi (yaitu, 95% kemungkinan a priori) ... maka, kami memiliki tingkat tinggi dari keyakinanbahwa interval kami mencakup rata-rata, karena kami mengatur semuanya secara probabilistik jadi ini memang demikian. Dengan demikian, CI 95% bukan interval probabilitas (seperti Bayesian Credible Interval), tetapi lebih seperti "penasihat tepercaya" ... seseorang yang, secara statistik, benar 95% dari waktu, jadi kami mempercayai jawaban mereka meskipun jawaban tertentu apa pun bisa saja salah.

Dalam 95% kasus di mana ia benar-benar menutupi parameter aktual, maka lebarnya memberitahu Anda sesuatu tentang kisaran nilai yang masuk akal yang diberikan data (yaitu, seberapa baik Anda dapat mengikat nilai sebenarnya), maka itu bertindak seperti ukuran presisi . Dalam 5% kasus di mana tidak, maka CI menyesatkan (karena sampel menyesatkan).

Jadi, apakah lebar CI 95% menunjukkan presisi ... Saya akan mengatakan ada kemungkinan 95% melakukannya (asalkan lebar CI Anda terbatas-positif) ;-)

Apa itu CI yang masuk akal?

Sebagai tanggapan terhadap posting penulis asli, saya telah merevisi tanggapan saya untuk (a) memperhitungkan bahwa contoh "sampel terpisah" memiliki tujuan yang sangat spesifik, dan (b) untuk memberikan latar belakang yang lebih seperti yang diminta oleh komentator:

Dalam dunia ideal (frequentist), semua distribusi sampel akan menerima statistik penting yang bisa kita gunakan untuk mendapatkan interval kepercayaan yang tepat. Apa yang hebat tentang statistik penting? Distribusi mereka dapat diturunkan tanpa mengetahui nilai aktual dari parameter yang diperkirakan! Dalam kasus-kasus yang bagus ini, kami memiliki distribusi yang tepat dari statistik sampel kami relatif terhadap parameter sebenarnya (walaupun mungkin tidak gaussian) tentang parameter ini.

Secara lebih ringkas: Kita tahu distribusi kesalahan (atau beberapa transformasi darinya).

Kualitas beberapa penaksir inilah yang memungkinkan kami membentuk interval kepercayaan yang masuk akal. Interval ini tidak hanya memenuhi definisi mereka ... mereka melakukannya berdasarkan diturunkan dari distribusi kesalahan estimasi yang sebenarnya.

Distribusi Gaussian dan statistik Z yang terkait adalah contoh kanonik dari penggunaan kuantitas penting untuk mengembangkan CI yang tepat untuk rata-rata. Ada contoh yang lebih esoteris, tetapi ini umumnya yang memotivasi "teori sampel besar", yang pada dasarnya merupakan upaya menerapkan teori di balik Gaussian CIs untuk distribusi yang tidak mengakui kuantitas sangat penting. Dalam kasus ini, Anda akan membaca tentang jumlah yang kira-kira penting, atau sangat penting asimtotis (dalam ukuran sampel) atau interval kepercayaan "perkiraan" ... ini didasarkan pada teori kemungkinan - khususnya, fakta bahwa distribusi kesalahan untuk banyak MLEs mendekati distribusi normal.

Pendekatan lain untuk menghasilkan CI yang masuk akal adalah "membalikkan" suatu uji hipotesis. Idenya adalah bahwa tes "baik" (misalnya, UMP) akan menghasilkan CI yang baik (baca: sempit) untuk tingkat kesalahan Tipe I yang diberikan. Ini tidak cenderung memberikan cakupan yang tepat, tetapi memberikan cakupan batas bawah (catatan: definisi sebenarnya dari X% -CI hanya mengatakan itu harus mencakup parameter sebenarnya setidaknya X% dari waktu).

Penggunaan tes hipotesis tidak secara langsung memerlukan kuantitas penting atau distribusi kesalahan - kepekaannya berasal dari kepekaan tes yang mendasarinya. Misalnya, jika kami memiliki tes yang wilayah penolakannya memiliki panjang 0 5% dari waktu dan panjang tak terbatas 95% dari waktu, kami akan kembali ke tempat kami dengan CI - tetapi jelas bahwa tes ini tidak tergantung pada data, dan karenanya tidak akan memberikan informasi apa pun tentang parameter mendasar yang sedang diuji.

Gagasan yang lebih luas ini - bahwa perkiraan ketelitian harus bergantung pada data, kembali ke Fischer dan gagasan statistik tambahan. Anda dapat yakin bahwa jika hasil tes atau prosedur CI Anda TIDAK dikondisikan oleh data (yaitu, perilaku kondisionalnya sama dengan perilaku tanpa syarat), maka Anda memiliki metode yang dipertanyakan di tangan Anda.

2

Alangkah baiknya jika Anda bisa menguraikan apa yang Anda tambahkan dalam "Catatan". Inilah yang saya pikir inti dari seluruh diskusi: orang dapat menyusun prosedur yang sering aneh namun valid untuk membangun CI di mana lebar CI tidak memiliki hubungan dengan presisi apa pun. Karena itu orang dapat berdebat, seperti Morey et al. lakukan, bahwa CI disesatkan pada prinsipnya. Saya setuju dengan Anda bahwa prosedur CI yang umum digunakan lebih masuk akal dari itu, tetapi orang harus jelas tentang apa yang membuatnya.

— Amoeba berkata Reinstate Monica

@amoeba Saya menambahkan beberapa penjelasan lebih lanjut tentang mengapa tidak semua CI dibuat sama ... ide utamanya adalah ancillarity, yang kedua adalah peran distribusi kesalahan (atau perkiraan untuk itu)

Terima kasih atas pembaruannya. Satu hal yang masih belum saya temukan dengan jelas dalam jawaban Anda, adalah pada paragraf pertama Anda tidak mengatakan apa - apa tentang lebar CI; Anda hanya membicarakannya mengandung atau tidak mengandung parameter populasi yang benar. Segala sesuatu di sana benar bahkan dalam kasus "patologis". Kemudian pada Anda mengatakan bahwa ya, lebar menunjukkan ketepatan, tetapi Anda belum memberikan argumen untuk itu (pada saat itu). Dalam diskusi nanti Anda menjelaskannya lebih lanjut.

— Amoeba berkata Reinstate Monica

@amoeba Saya kira posting saya bisa lakukan dengan sedikit lebih banyak format. Logika dasarnya adalah ini (dengan asumsi kita menggunakan prosedur CI "masuk akal" seperti yang saya uraikan): ada kemungkinan 95% apriori bahwa interval akan berisi parameter yang benar. Setelah kami mengumpulkan data, kami memiliki interval kami yang sebenarnya (terbatas, lebar tidak nol). JIKA itu berisi parameter sebenarnya, maka lebar menyatakan kisaran nilai yang masuk akal, maka lebar membatasi rentang parameter. NAMUN, dalam 5% kasus di mana interval tidak mengandung nilai, maka intervalnya menyesatkan.

@amoeba memperbarui pos untuk lebih menekankan hubungan antara lebar dan presisi CI.

8

$\{x_1, x_2, \ldots , x_n \}$ $(\mu, \sigma^2)$ $\mu$ $(- \infty, \infty)$ $\{ 0 \}$ berdasarkan pada flip dari koin bias. Dengan menggunakan bias yang tepat kita bisa mendapatkan tingkat kepercayaan apa pun yang kita suka, tetapi jelas interval "perkiraan" kita tidak memiliki presisi sama sekali bahkan jika kita berakhir dengan interval yang memiliki lebar nol.

Alasan mengapa saya tidak berpikir kita harus peduli tentang kesalahan jelas ini adalah bahwa meskipun benar bahwa tidak ada koneksi yang diperlukan antara lebar interval keyakinan dan presisi, ada adalah koneksi hampir universal antara kesalahan standar dan presisi, dan di kebanyakan kasus, lebar interval kepercayaan sebanding dengan kesalahan standar.

$\sigma$

— dsaxton
sumber

Poin bagus tentang CI acak tak terbatas ... pasti menunjukkan bahwa kepercayaan diri adalah konsep yang berbeda dari presisi. Saya mungkin harus mengabaikan tanggapan saya dengan mengatakan bahwa saya mengasumsikan CI berbasis kemungkinan, di mana lebarnya terkait dengan kelengkungan dari kemungkinan log, yang merupakan perkiraan kesalahan standar ... posting Anda menunjukkan bahwa ada CI yang secara teknis mencapai cakupan tetapi dengan cara yang sangat intuitif.

Masalah terkait (meskipun sangat menarik) adalah subset yang relevan untuk CI ... misalnya, jika Anda mengkondisikan pada statistik tambahan, cakupan CI Anda dapat berubah (satu kasus di titik adalah bahwa cakupan bersyarat dari interval-t bersyarat) perubahan berdasarkan variabilitas sampel Anda). Berikut tautan ke makalah: jstor.org/stable/2242024?seq=1#page_scan_tab_contents

@Dengan Ada contoh lain yang tidak terlalu ekstrem dari makalah ini yang melibatkan kapal selam: webfiles.uci.edu/mdlee/fundamentalError.pdf . Ini yang menarik, tetapi sekali lagi tampaknya merupakan kasus interpretasi yang tidak akan dilakukan oleh orang yang cerdas.

— dsaxton

Setuju .... tidak dapat meninggalkan akal sehat di pintu dengan statistik ... bahkan di Machine Learning (agak keliru)

1

@richarddmorey: Oke, saya mengerti. Kemudian itu hanya formulasi yang tidak menguntungkan! Saya tidak sengaja membawanya keluar dari konteks; Saya jujur membaca kalimat ini sebagai ringkasan dan generalisasi untuk situasi apa pun (tidak menyadari bahwa "dalam contoh itu" diasumsikan dalam kalimat itu). Pertimbangkan meninggalkan komentar klarifikasi di utas lainnya dengan tuduhan saya (yang sudah mendapatkan beberapa suara positif)

— Amuba kata Reinstate Monica

4

Saya pikir perbedaan yang dapat dibuktikan antara "interval kepercayaan" dan "presisi" (lihat jawaban dari @dsaxton) penting karena perbedaan itu menunjukkan masalah dalam penggunaan umum kedua istilah.

Mengutip dari Wikipedia :

Ketepatan sistem pengukuran, terkait dengan reproduktifitas dan pengulangan, adalah sejauh mana pengukuran berulang dalam kondisi yang tidak berubah menunjukkan hasil yang sama.

Dengan demikian, orang mungkin berpendapat bahwa interval kepercayaan yang sering terjadi memang mewakili tipe ketepatan skema pengukuran . Jika seseorang mengulangi skema yang sama, CI 95% yang dihitung untuk setiap pengulangan akan berisi satu nilai sebenarnya dari parameter dalam 95% dari pengulangan.

Namun, ini bukan yang diinginkan banyak orang dari ukuran kepraktisan praktis. Mereka ingin tahu seberapa dekat nilai diukur dengan benar nilai . Interval kepercayaan sering tidak secara ketat memberikan ukuran ketelitian. Daerah kredibel Bayesian lakukan.

Beberapa kebingungannya adalah bahwa, dalam contoh praktis, interval kepercayaan yang sering terjadi dan wilayah Bayesian yang kredibel "akan lebih atau kurang tumpang tindih" . Pengambilan sampel dari distribusi normal, seperti dalam beberapa komentar di OP, adalah contohnya. Itu mungkin juga merupakan kasus dalam praktik untuk beberapa jenis analisis yang lebih luas yang ada dalam pikiran @Bey, berdasarkan perkiraan kesalahan standar dalam proses yang memiliki distribusi normal dalam batas tersebut.

Jika Anda tahu bahwa Anda berada dalam situasi seperti itu , maka mungkin tidak ada bahaya praktis dalam menafsirkan 95% CI tertentu, dari implementasi tunggal dari skema pengukuran, karena memiliki kemungkinan 95% mengandung nilai sebenarnya. Interpretasi interval kepercayaan itu, bagaimanapun, bukan dari statistik frequentist, yang nilainya sebenarnya baik atau tidak dalam interval tertentu.

Jika interval kepercayaan dan wilayah kredibel berbeda nyata, interpretasi seperti interval kepercayaan frequentist Bayesian bisa menyesatkan atau salah, seperti yang ditunjukkan oleh makalah terkait di atas dan literatur sebelumnya yang dirujuk di dalamnya. Ya, "akal sehat" mungkin membantu menghindari kesalahpahaman seperti itu, tetapi dalam pengalaman saya "akal sehat" tidak begitu umum.

Halaman CrossValidated lainnya mengandung lebih banyak informasi tentang interval kepercayaan dan perbedaan antara interval kepercayaan dan wilayah yang kredibel . Tautan dari halaman tersebut juga sangat informatif.

— EdM
sumber

Ini adalah poin yang bagus .... Saya pikir pemikiran terdekat dengan interpretasi umum "presisi" lebih seperti kesalahan RMS. Perkiraan yang tidak bias tetapi sangat bervariasi dipandang tidak lebih baik dari penaksir variabilitas rendah tetapi sangat bias ... keduanya tidak dapat diandalkan untuk memberikan perkiraan yang mendekati nilai sebenarnya.

+1, tetapi saya tidak yakin saya membagikan pandangan pesimis Anda tentang "akal sehat". Ada kutipan besar dari Jeffreys tentang "akal sehat" dalam statistik frequentist:

I have in fact been struck repeatedly in my own work, after being led on general principles to the solution of a problem, to find that Fisher had already grasped the essentials by some brilliant piece of common sense

.

— Amuba kata Reinstate Monica

@amoeba mempertimbangkan klaim Laplace bahwa "Teori probabilitas tidak lain adalah akal sehat yang dikurangi menjadi perhitungan." Upaya yang dicurahkan sejak saat itu untuk teori probabilitas setidaknya menunjukkan bahwa implikasi akal sehat tidak selalu segera jelas.

— EdM

@amoeba: Fisher menolak CI, dan mengidentifikasi Fisher sebagai freq-ist. menyesatkan. Logikanya interval (fiducial) mirip dengan obj. Bayes, dan dia mengidentifikasi probabilitas dengan ketidakpastian rasional. Dia mengatakan ini: "Kadang-kadang ditegaskan bahwa metode fidusia umumnya mengarah ke hasil yang sama dengan metode [CI]. Sulit untuk memahami bagaimana hal ini bisa terjadi, karena telah ditetapkan dengan kuat bahwa metode kepercayaan Interval tidak mengarah pada pernyataan probabilitas tentang parameter dunia nyata, sedangkan argumen fidusia ada untuk tujuan ini. " (Fisher, 1959)

— richarddmorey

@ Richard, Terima kasih atas klarifikasi. Fisher diketahui telah mengatakan hal-hal yang bertentangan sepanjang kariernya yang panjang dan telah mengubah pendapatnya beberapa kali. Saya tidak terlalu akrab dengan teori fiducial-nya sehingga tidak bisa mengomentari itu. Asumsi bawah sadar saya adalah bahwa Jeffreys dalam kutipan itu merujuk pada "periode sering" Fisher, tetapi saya tidak punya bukti untuk itu. Dalam pengalaman saya (terbatas!), Tidak ada yang pernah menggunakan inferensi fidusia. Tak seorangpun. Pernah. Sedangkan teknik frequentist digunakan sepanjang waktu dan banyak yang kembali ke Fisher. Karenanya asosiasi ada dalam pikiran saya.

— Amuba kata Reinstate Monica

1

@Dengan memilikinya. Tidak ada hubungan yang diperlukan antara skor dan kinerja atau harga dan kualitas atau bau dan rasa. Namun yang satu biasanya menginformasikan tentang yang lain.

Seseorang dapat membuktikan dengan induksi bahwa seseorang tidak dapat memberikan kuis. Pada pemeriksaan dekat ini berarti seseorang tidak dapat menjamin kuis itu kejutan. Namun sebagian besar waktu akan terjadi.

Kedengarannya seperti Morey et al menunjukkan bahwa ada kasus di mana lebarnya tidak informatif. Meskipun itu cukup untuk mengklaim "Tidak ada hubungan yang diperlukan antara ketepatan estimasi dan ukuran interval kepercayaan", tidak cukup untuk menyimpulkan lebih lanjut bahwa CI umumnya tidak mengandung informasi tentang ketepatan. Hanya bahwa mereka tidak dijamin melakukannya.

(Poin tidak cukup untuk + @ Bey jawaban.)

— ctwardy
sumber