Mengapa 95% CI tidak menyiratkan peluang 95% mengandung mean?
Ada banyak masalah yang harus diklarifikasi dalam pertanyaan ini dan di sebagian besar tanggapan yang diberikan. Saya akan membatasi diri hanya untuk mereka berdua.
Sebuah. Apa yang dimaksud dengan populasi? Apakah ada populasi yang benar-benar berarti?
Konsep rata-rata populasi tergantung pada model. Karena semua model salah, tetapi beberapa berguna, rerata populasi ini adalah fiksi yang didefinisikan hanya untuk memberikan interpretasi yang bermanfaat. Fiksi dimulai dengan model probabilitas.
Model probabilitas ditentukan oleh triplet
mana X adalah ruang sampel (set non-kosong), F adalah keluarga himpunan bagian dari X dan P adalah ukuran probabilitas yang didefinisikan dengan baik didefinisikan lebih dari F (Ini mengatur perilaku data). Tanpa kehilangan keumuman, pertimbangkan hanya kasus diskrit. Populasi berarti didefinisikan oleh
μ = Σ x ∈ X x P ( X = x ) , yaitu, itu merupakan tendensi sentral di bawah P
(X,F,P),
XFXPFμ=∑x∈XxP(X=x),
Pdan itu juga dapat diartikan sebagai pusat massa semua titik dalam
, di mana bobot masing-masing
x ∈ X diberikan oleh
P ( X = x ) .
Xx∈XP(X=x)
Dalam teori probabilitas, ukuran dianggap diketahui, oleh karena itu rata-rata populasi dapat diakses melalui operasi sederhana di atas. Namun, dalam praktiknya, probabilitas P hampir tidak diketahui. Tanpa probabilitas P , seseorang tidak dapat menggambarkan perilaku probabilistik data. Karena kami tidak dapat menetapkan probabilitas P yang tepat untuk menjelaskan perilaku data, kami menetapkan keluarga M yang berisi ukuran probabilitas yang mungkin mengatur (atau menjelaskan) perilaku data. Kemudian, model statistik klasik muncul
( X , F , M ) .
Model di atas dikatakan sebagai model parametrik jika ada ΘPPPPM
(X,F,M).
dengan
p < ∞ sehingga
M ≡ { P θ : θ ∈ q } . Mari kita perhatikan hanya model parametrik dalam posting ini.
Θ⊆Rpp<∞M≡{Pθ: θ∈Θ}
Perhatikan bahwa, untuk setiap ukuran probabilitas , ada masing-masing definisi rata-rata
μPθ∈M
Artinya, ada keluarga berarti populasi { μ q : q ∈ q } yang tergantung erat pada definisi M . Keluarga M
μθ=∑x∈XxPθ(X=x).
{μθ: θ∈Θ}MMdidefinisikan oleh manusia terbatas dan oleh karena itu mungkin tidak mengandung ukuran probabilitas sejati yang mengatur perilaku data. Sebenarnya, keluarga yang dipilih tidak akan mengandung ukuran yang sebenarnya, apalagi ukuran yang sebenarnya ini mungkin tidak ada. Karena konsep rata-rata populasi tergantung pada ukuran probabilitas dalam
, rata- rata populasi tergantung pada model.
M
Pendekatan Bayesian mempertimbangkan probabilitas sebelumnya atas himpunan bagian (atau, setara, Θ ), tetapi dalam posting ini saya hanya akan berkonsentrasi pada versi klasik.MΘ
b. Apa definisi dan tujuan dari interval kepercayaan?
Seperti disebutkan di atas, mean populasi tergantung pada model dan memberikan interpretasi yang bermanfaat. Namun, kami memiliki kumpulan populasi rata-rata, karena model statistik didefinisikan oleh keluarga pengukuran probabilitas (setiap pengukuran probabilitas menghasilkan mean populasi). Oleh karena itu, berdasarkan percobaan, prosedur inferensial harus digunakan untuk memperkirakan set kecil (interval) yang mengandung kandidat yang baik dari populasi rata-rata. Satu prosedur yang terkenal adalah ( ) wilayah keyakinan, yang didefinisikan oleh satu set C α sehingga, untuk semua q ∈ q ,
P θ ( C α ( X ) ∋ μ1−αCαθ∈Θ mana P θ ( C α ( X ) = ∅ ) = 0 (lihat Schervish, 1995). Ini adalah definisi yang sangat umum dan mencakup hampir semua interval kepercayaan. Di sini, P θ ( C α ( X )
Pθ(Cα(X)∋μθ)≥1−α and infθ∈ΘPθ(Cα(X)∋μθ)=1−α,
Pθ(Cα(X)=∅)=0 adalah probabilitas bahwa
C α ( X ) mengandung
μ θ di bawah ukuran
P θ . Probabilitas ini harus selalu lebih besar dari (atau sama dengan)
1 - α , kesetaraan terjadi pada kasus terburuk.
Pθ(Cα(X)∋μθ)Cα(X)μθPθ1−α
M
Di satu sisi, sebelum mengamati data,Cα(X)Cα(X)μθ(1−α)θ∈Θ
xCα(x)Cα(x)μθθ∈Θ
Yaitu, setelah mengamati dataxCα(x)(1−α)100%μθθ∈Θ
PS: Saya mengundang komentar, ulasan, kritik, atau bahkan keberatan dengan posting saya. Mari kita bahas secara mendalam. Karena saya bukan penutur asli bahasa Inggris, tulisan saya pasti mengandung kesalahan ketik dan kesalahan tata bahasa.
Referensi:
Schervish, M. (1995), Teori Statistik, ed Kedua, Springer.