Fungsi diskrit: Cakupan interval kepercayaan?

Bagaimana cara menghitung cakupan interval diskrit?

Apa yang saya tahu bagaimana melakukannya:

Jika saya memiliki model kontinu, saya bisa menentukan interval kepercayaan 95% untuk masing-masing nilai prediksi saya, dan kemudian melihat seberapa sering nilai aktual berada dalam interval kepercayaan. Saya mungkin menemukan bahwa hanya 88% dari waktu interval kepercayaan 95% saya mencakup nilai aktual.

Apa yang saya tidak tahu bagaimana melakukannya:

Bagaimana saya melakukan ini untuk model diskrit, seperti poisson atau gamma-poisson? Apa yang saya miliki untuk model ini adalah sebagai berikut, mengambil satu pengamatan (dari lebih dari 100.000 yang saya rencanakan untuk dihasilkan :)

Pengamatan #: (sewenang-wenang)

Nilai prediksi: 1,5

Probabilitas yang diprediksi 0: .223

Kemungkinan prediksi 1: 0,335

Kemungkinan prediksi 2: .251

Prediksi probabilitas 3: .126

Kemungkinan prediksi 4: .048

Probabilitas yang diprediksi 5: 0,014 [dan 5 atau lebih adalah 0,019]

... (dll)

Probabilitas yang diprediksi 100 (atau untuk beberapa angka yang tidak realistis): .000

Nilai aktual (bilangan bulat seperti "4")

Perhatikan bahwa sementara saya telah memberikan nilai poisson di atas, dalam model aktual nilai prediksi 1,5 mungkin memiliki probabilitas prediksi berbeda 0,1, ... 100 melintasi pengamatan.

Saya bingung dengan keleluasaan nilai. "5" jelas di luar interval 95%, karena hanya ada 0,019 pada 5 dan di atas, yang kurang dari 0,025. Tetapi akan ada banyak 4 - secara individual mereka berada di dalam, tetapi bagaimana saya bersama-sama mengevaluasi jumlah 4 lebih tepat?

Kenapa saya peduli?

Model yang saya lihat telah dikritik karena akurat pada tingkat agregat tetapi memberikan prediksi individu yang buruk. Saya ingin melihat seberapa buruk prediksi individu miskin daripada interval kepercayaan yang secara inheren luas diprediksi oleh model. Saya mengharapkan cakupan empiris menjadi lebih buruk (misalnya saya mungkin menemukan 88% dari nilai berada dalam interval kepercayaan 95%), tetapi saya berharap hanya sedikit lebih buruk.

confidence-interval discrete-data

— zbicyclist
sumber

Interval kepercayaan Neyman tidak berusaha memberikan cakupan parameter dalam hal interval tertentu. Sebagai gantinya mereka memberikan cakupan atas semua nilai parameter yang mungkin dalam jangka panjang. Dalam arti mereka berusaha akurat secara global dengan mengorbankan akurasi lokal.

Interval kepercayaan untuk proporsi binomial menawarkan ilustrasi yang jelas tentang masalah ini. Penilaian interval Neymanian menghasilkan plot cakupan tidak teratur seperti ini, yang untuk interval Clopper-Pearson 95% untuk n = 10 percobaan Binomial:

Plot cakupan Clopper-Pearson

Ada cara alternatif untuk melakukan peliputan, yang menurut saya pribadi jauh lebih mudah didekati secara intuitif dan (dengan demikian) bermanfaat. Cakupan dengan interval dapat ditentukan tergantung pada hasil yang diamati. Cakupan itu akan menjadi cakupan lokal. Berikut ini adalah plot yang menunjukkan cakupan lokal untuk tiga metode perhitungan interval kepercayaan yang berbeda untuk proporsi binomial: Clopper-Pearson, skor Wilson, dan metode eksak kondisional yang menghasilkan interval yang identik dengan interval Bayesian dengan seragam sebelumnya:

Cakupan bersyarat untuk tiga jenis interval

Perhatikan bahwa metode 95% Clopper-Pearson memberikan lebih dari 98% cakupan lokal tetapi interval bersyarat yang tepat, yah, tepat.

Cara untuk memikirkan perbedaan antara interval global dan lokal adalah dengan menganggap global sebagai inversi dari uji hipotesis Neyman-Pearson di mana hasilnya adalah keputusan yang dibuat berdasarkan pertimbangan tingkat kesalahan jangka panjang untuk saat ini. bereksperimen sebagai anggota rangkaian global semua eksperimen yang mungkin dijalankan. Interval lokal lebih mirip dengan inversi tes signifikansi Nelayan yang menghasilkan nilai P yang mewakili bukti terhadap nol dalam percobaan khusus ini .

(Sejauh yang saya tahu, perbedaan antara statistik global dan lokal pertama kali dibuat dalam tesis Guru yang tidak diterbitkan oleh Claire F Leslie (1998). Kurangnya kepercayaan: studi tentang penindasan terhadap contoh tandingan tertentu terhadap teori Neyman-Pearson tentang inferensi statistik dengan referensi khusus pada teori interval kepercayaan. Tesis itu dipegang oleh perpustakaan Baillieu di The University of Melbourne.)

— Michael Lew
sumber

Saya tidak berpikir Claire Leslie menemukan perbedaan global / lokal, tetapi dia memang memberikan deskripsi rinci yang indah tentang itu, dengan banyak referensi. Saya juga sangat merekomendasikan tesisnya.