Latar Belakang
Saya merancang simulasi Monte Carlo yang menggabungkan output dari serangkaian model, dan saya ingin memastikan bahwa simulasi akan memungkinkan saya untuk membuat klaim yang masuk akal tentang probabilitas hasil simulasi dan ketepatan estimasi probabilitas itu.
Simulasi akan menemukan kemungkinan bahwa juri yang diambil dari komunitas tertentu akan menghukum terdakwa tertentu. Ini adalah langkah-langkah simulasi:
Dengan menggunakan data yang ada, hasilkan model probabilitas logistik ( M ) dengan merundingkan "pemilihan suara juri pertama" pada prediktor demografis.
Gunakan metode Monte Carlo untuk mensimulasikan 1.000 versi M (yaitu, 1.000 versi koefisien untuk parameter model).
Pilih salah satu dari 1.000 versi model ( M i ).
Empanel 1.000 juri dengan secara acak memilih 1.000 set 12 "juri" dari "komunitas" ( C ) individu dengan distribusi karakteristik demografis tertentu.
Secara deterministik menghitung probabilitas pemungutan suara bersalah pertama untuk setiap anggota juri menggunakan M i .
Berikan setiap suara "juri" kemungkinan menjadi suara yang menentukan (berdasarkan apakah itu lebih besar atau kurang dari nilai yang dipilih secara acak antara 0-1).
Tentukan masing-masing "suara akhir" juri dengan menggunakan model (yang berasal dari data empiris) dari probabilitas yang akan dijatuhkan oleh juri, tergantung pada proporsi juri yang memberikan suara untuk penghukuman pada pemungutan suara pertama.
Simpan proporsi vonis bersalah untuk 1000 juri ( PG i ).
Ulangi langkah 3-8 untuk masing-masing 1.000 versi M yang disimulasikan .
Hitung nilai rata-rata dari PG dan laporan bahwa sebagai estimasi titik probabilitas keyakinan di C .
Identifikasi nilai persentil 2,5 & 97,5 untuk PG dan laporkan sebagai interval kepercayaan 0,95.
Saat ini saya menggunakan 1.000 juri dan 1.000 juri pada teori bahwa 1.000 acak diambil dari distribusi probabilitas — karakteristik demografis C atau versi M akan mengisi distribusi itu.
Pertanyaan
Apakah ini memungkinkan saya untuk secara akurat menentukan ketepatan estimasi saya? Jika demikian, berapa banyak juri yang harus saya empanel untuk setiap PG i perhitungan untuk penutup C 's distribusi probabilitas (jadi saya seleksi menghindari bias); bolehkah saya menggunakan kurang dari 1.000?
Terima kasih banyak atas bantuannya!