Bagaimana cara menghitung cakupan interval diskrit?
Apa yang saya tahu bagaimana melakukannya:
Jika saya memiliki model kontinu, saya bisa menentukan interval kepercayaan 95% untuk masing-masing nilai prediksi saya, dan kemudian melihat seberapa sering nilai aktual berada dalam interval kepercayaan. Saya mungkin menemukan bahwa hanya 88% dari waktu interval kepercayaan 95% saya mencakup nilai aktual.
Apa yang saya tidak tahu bagaimana melakukannya:
Bagaimana saya melakukan ini untuk model diskrit, seperti poisson atau gamma-poisson? Apa yang saya miliki untuk model ini adalah sebagai berikut, mengambil satu pengamatan (dari lebih dari 100.000 yang saya rencanakan untuk dihasilkan :)
Pengamatan #: (sewenang-wenang)
Nilai prediksi: 1,5
Probabilitas yang diprediksi 0: .223
Kemungkinan prediksi 1: 0,335
Kemungkinan prediksi 2: .251
Prediksi probabilitas 3: .126
Kemungkinan prediksi 4: .048
Probabilitas yang diprediksi 5: 0,014 [dan 5 atau lebih adalah 0,019]
... (dll)
Probabilitas yang diprediksi 100 (atau untuk beberapa angka yang tidak realistis): .000
Nilai aktual (bilangan bulat seperti "4")
Perhatikan bahwa sementara saya telah memberikan nilai poisson di atas, dalam model aktual nilai prediksi 1,5 mungkin memiliki probabilitas prediksi berbeda 0,1, ... 100 melintasi pengamatan.
Saya bingung dengan keleluasaan nilai. "5" jelas di luar interval 95%, karena hanya ada 0,019 pada 5 dan di atas, yang kurang dari 0,025. Tetapi akan ada banyak 4 - secara individual mereka berada di dalam, tetapi bagaimana saya bersama-sama mengevaluasi jumlah 4 lebih tepat?
Kenapa saya peduli?
Model yang saya lihat telah dikritik karena akurat pada tingkat agregat tetapi memberikan prediksi individu yang buruk. Saya ingin melihat seberapa buruk prediksi individu miskin daripada interval kepercayaan yang secara inheren luas diprediksi oleh model. Saya mengharapkan cakupan empiris menjadi lebih buruk (misalnya saya mungkin menemukan 88% dari nilai berada dalam interval kepercayaan 95%), tetapi saya berharap hanya sedikit lebih buruk.