Saya menafsirkan pertanyaan seperti ini: seandainya pengambilan sampel konon dilakukan seolah-olah tiket kertas putih dimasukkan ke dalam botol, masing-masing dilabeli dengan nama satu orang, dan diambil secara acak setelah secara menyeluruh mengaduk isi botol itu. Sebelumnya, tiket diwarnai merah. Berapa peluang tepatnya dua tiket yang dipilih berwarna merah? Berapa peluang bahwa paling banyak dua tiket berwarna merah?232 1236323212
Formula yang tepat dapat diperoleh, tetapi kita tidak perlu melakukan banyak pekerjaan teoritis. Sebagai gantinya, kami hanya melacak peluang saat tiket ditarik dari toples. Pada saat dari mereka telah ditarik, biarkan kesempatan yang tepat tiket merah telah terlihat ditulis . Untuk memulai, perhatikan bahwa jika i > 0 (Anda tidak dapat memiliki tiket merah sebelum Anda mulai) dan p ( 0 , 0 ) = 1 (sudah pasti Anda tidak memiliki tiket merah di awal). Sekarang, pada undian terbaru, baik tiketnya merah atau bukan. Dalam kasus pertama, kami sebelumnya memiliki kesempatani p ( i , m ) p ( i , 0 ) = 0msayap ( i , m )p ( i , 0 ) = 0i > 0p ( 0 , 0 ) = 1 untuk melihat secara tepat i - 1 tiket merah. Kami kemudian terjadi kemudian untuk menarik yang merah dari sisa 363 - m + 1 tiket, membuatnya persis saya tiket merah sejauh ini. Karena kami menganggap semua tiket memiliki peluang yang sama di setiap tahap, maka kesempatan kami untuk menggambar merah dengan cara ini adalah ( 12 - i + 1 ) / ( 363 - m + 1 ) . Dalam kasus lain, kami memiliki kesempatanp ( i - 1 , m - 1 )i - 1363 - m + 1saya( 12 - i + 1 ) / ( 363 - m + 1 ) untuk mendapatkan persisnya saya merah diundian m - 1 sebelumnya, dan kemungkinantidakmenambahkan tiket merah lain ke sampel pada undian berikutnya adalah ( 363 - m + 1 - 12 + i ) / ( 363 - m + 1 ) . Dari mana, menggunakan aksioma dasar probabilitas (yaitu, kemungkinan dua kasus yang saling eksklusif menambah dan peluang bersyarat bertambah banyak),p ( i , m - 1 )sayam - 1( 363 - m + 1 - 12 + i ) / ( 363 - m + 1 )
p ( i , m ) = p ( i - 1 , m - 1 ) ( 12 - i + 1 ) + p ( i , m - 1 ) ( 363 - m + 1 - 12 + i )363 - m + 1.
Kami mengulangi perhitungan ini secara rekursif, meletakkan array segitiga dari nilai-nilai untuk 0 ≤ i ≤ 12 dan 0 ≤ m ≤ 232 . Setelah sedikit perhitungan kita memperoleh p ( 2 , 232 ) ≈ 0,000849884 dan p ( 0 , 232 ) + p ( 1 , 232 ) + p ( 2 , 232 ) ≈p ( i , m )0 ≤ i ≤ 120 ≤ m ≤ 232p ( 2 , 232 ) ≈ 0,000849884 , menjawab kedua versi pertanyaan. Ini adalah angka kecil: tidak peduli bagaimana Anda melihatnya, itu adalah peristiwa yang cukup langka (jarang lebih dari satu dalam seribu).p ( 0 , 232 ) + p ( 1 , 232 ) + p ( 2 , 232 ) ≈ 0,000934314
Sebagai pemeriksaan ulang, saya melakukan latihan ini dengan komputer 1.000.000 kali. Pada 932 = 0,000932 percobaan ini, 2 atau lebih sedikit tiket merah diamati. Ini sangat dekat dengan hasil yang dihitung, karena fluktuasi pengambilan sampel pada nilai yang diharapkan dari 934,3 adalah sekitar 30 (naik atau turun). Inilah cara simulasi dilakukan dalam R:
> population <- c(rep(1,12), rep(0, 363-12)) # 1 is a "red" indicator
> results <- replicate(10^6,
sum(sample(population, 232))) # Count the reds in 10^6 trials
> sum(results <= 2) # How many trials had 2 or fewer reds?
[1] 948
Kali ini, karena percobaannya acak, hasilnya berubah sedikit: dua atau lebih sedikit tiket merah diamati pada 948 dari sejuta percobaan. Itu masih konsisten dengan hasil teoretis.)
Kesimpulannya adalah bahwa sangat tidak mungkin bahwa dua atau kurang dari 232 tiket akan berwarna merah. Jika Anda memang memiliki sampel 232 dari 363 orang, hasil ini merupakan indikasi kuat bahwa model tiket-dalam-wadah tidak merupakan deskripsi yang benar tentang bagaimana sampel diperoleh. Penjelasan alternatif termasuk (a) tiket merah dibuat lebih sulit untuk diambil dari toples ("bias" terhadap mereka) serta (b) tiket diwarnai setelah sampel diamati ( data post-hoc mengintai, yang tidak tidak menunjukkan bias apa pun).
Contoh penjelasan (b) dalam aksi akan menjadi kumpulan juri untuk pengadilan pembunuhan yang terkenal kejam. Misalkan itu termasuk 363 orang. Keluar dari kolam itu, pengadilan mewawancarai 232 dari mereka. Seorang reporter surat kabar yang ambisius dengan cermat menelaah riwayat hidup semua orang di kolam renang dan mengetahui bahwa 12 dari 363 adalah peternak ikan mas, tetapi hanya dua dari mereka yang diwawancarai. Apakah pengadilan bias terhadap peternak ikan mas? Mungkin tidak.