Berapa probabilitas orang ini adalah wanita?


32

Ada seseorang di balik tirai - saya tidak tahu apakah orang itu perempuan atau laki-laki.

Saya tahu orang itu memiliki rambut panjang, dan 90% dari semua orang dengan rambut panjang adalah perempuan

Saya tahu orang tersebut memiliki tipe darah AX3 yang langka, dan bahwa 80% dari semua orang dengan tipe darah ini adalah wanita.

Berapa probabilitas orang itu perempuan?

CATATAN: formulasi asli ini telah diperluas dengan dua asumsi lebih lanjut: 1. Golongan darah dan panjang rambut independen 2. Rasio pria: wanita dalam populasi pada umumnya adalah 50:50

(Skenario spesifik di sini tidak begitu relevan - lebih tepatnya, saya memiliki proyek mendesak yang mengharuskan saya mengarahkan pikiran saya pada pendekatan yang benar untuk menjawab ini. Perasaan saya adalah bahwa ini adalah masalah probabilitas sederhana, dengan jawaban definitif sederhana, alih-alih daripada sesuatu dengan beberapa jawaban yang bisa diperdebatkan menurut teori statistik yang berbeda.


1
Tidak ada banyak teori probabilitas, tetapi terkenal benar bahwa orang memiliki kesulitan berpikir dengan benar tentang probabilitas. (Augustus DeMorgan, seorang ahli matematika yang baik, menyerah studi tentang probabilitas karena kesulitannya.) Jangan melihat perdebatan: mencari permohonan untuk prinsip-prinsip probabilitas (seperti aksioma Kolmogorov). Jangan biarkan ini diselesaikan secara demokratis: pertanyaan Anda menarik banyak jawaban salah yang, bahkan jika beberapa dari mereka setuju, hanya secara kolektif salah. @Michael C memberikan panduan yang baik; jawabanku mencoba menunjukkan kepadamu mengapa dia benar.
Whuber

@ Wouber, jika kemerdekaan diasumsikan, apakah Anda setuju bahwa 0,97297 adalah jawaban yang benar? (Saya percaya bahwa jawabannya mungkin antara 0% dan 100% tanpa asumsi ini - diagram Anda menunjukkan ini dengan baik).
Mungkin

Kemandirian apa, tepatnya? Apakah Anda menyarankan bahwa gaya rambut wanita dan pria sama? Seperti yang Anda katakan dalam pertanyaan Anda, skenario khusus yang melibatkan jenis kelamin / rambut / darah ini mungkin tidak relevan: itu memberitahu saya bahwa Anda berusaha memahami cara menyelesaikan masalah seperti ini secara umum. Untuk melakukan itu, Anda perlu mengetahui asumsi mana yang menyiratkan kesimpulan mana. Dengan demikian, Anda perlu fokus dengan sangat hati-hati pada asumsi yang ingin Anda buat dan menentukan dengan tepat berapa banyak yang memungkinkan Anda untuk menyimpulkan.
whuber

3
Jenis kemandirian untuk mengeksplorasi menyangkut kombinasi ketiga karakteristik tersebut. Misalnya, jika AX3 adalah penanda untuk sindrom yang mencakup kebotakan pada wanita (tetapi tidak pada pria), maka setiap orang berambut panjang dengan AX3 adalah pria, membuat kemungkinan menjadi wanita 0%, bukan 97,3%. Saya harap ini menjelaskan bahwa siapa pun yang menghasilkan jawaban pasti untuk pertanyaan ini harus membuat asumsi tambahan, bahkan jika mereka tidak secara eksplisit mengakuinya. Jawaban yang benar-benar bermanfaat, IMHO, adalah jawaban yang menunjukkan secara langsung bagaimana berbagai asumsi menghasilkan hasil yang berbeda.
whuber

2
Anda kehilangan kemungkinan bahwa perempuan tidak memiliki rambut panjang. Itu ukuran kritis.
Daniel R Hicks

Jawaban:


35

Banyak orang merasa terbantu untuk berpikir mengenai "populasi", subkelompok di dalamnya, dan proporsi (daripada probabilitas). Ini cocok dengan alasan visual.

Saya akan menjelaskan angka-angka secara rinci, tetapi tujuannya adalah bahwa perbandingan cepat dari kedua angka tersebut harus segera dan meyakinkan menunjukkan bagaimana dan mengapa tidak ada jawaban spesifik untuk pertanyaan yang dapat diberikan. Pemeriksaan yang sedikit lebih lama akan menyarankan informasi tambahan apa yang akan berguna untuk menentukan jawaban atau setidaknya mendapatkan batasan pada jawaban.

diagram Venn

Legenda

Penetasan silang : betina / Latar belakang padat : jantan.

Atas : berambut panjang / Bawah : berambut pendek.

Kanan (dan berwarna) : AX3 / Kiri (tidak berwarna ) : non-AX3.

Data

Penetasan silang atas adalah 90% dari persegi panjang atas ("90% dari semua orang dengan rambut panjang adalah perempuan").

Penetasan silang total dalam persegi panjang berwarna kanan adalah 80% dari persegi panjang itu ("80% dari semua orang dengan golongan darah ini adalah wanita.")

Penjelasan

Diagram ini menunjukkan secara skematis bagaimana populasi (dari semua wanita dan non-wanita yang dipertimbangkan) dapat secara bersamaan dipartisi menjadi wanita / non-wanita, AX3 / non-AX3, dan berambut panjang / tidak berambut panjang ("pendek"). Menggunakan area, setidaknya kira-kira, untuk mewakili proporsi (ada beberapa berlebihan untuk membuat gambar lebih jelas).

Jelaslah bahwa ketiga klasifikasi biner ini menciptakan delapan kelompok yang mungkin. Setiap grup muncul di sini.

Informasi yang diberikan menyatakan bahwa rectangle cross-hatched rectangle (wanita berambut panjang) terdiri dari 90% dari rectangle top (semua orang berambut panjang). Ini juga menyatakan bahwa bagian gabungan lintas-menetas dari persegi panjang berwarna (perempuan berambut panjang dengan AX3 dan perempuan berambut pendek dengan AX3) terdiri dari 80% wilayah berwarna di sebelah kanan (semua orang dengan AX3). Kami diberitahu bahwa seseorang terletak di sudut kanan atas (panah): orang berambut panjang dengan AX3. Berapa proporsi persegi panjang ini yang menetas silang (betina)?

Saya juga (secara implisit) berasumsi bahwa golongan darah dan panjang rambut tidak tergantung : proporsi dari persegi panjang atas (rambut panjang) yang diwarnai (AX3) sama dengan proporsi persegi panjang bawah (rambut pendek) yang diwarnai (AX3). Itulah arti kemerdekaan. Ini adalah asumsi yang wajar dan alami ketika menjawab pertanyaan seperti ini, tetapi tentu saja perlu dinyatakan.

Posisi persegi panjang lintas silang (betina berambut panjang) tidak diketahui. Kita dapat membayangkan menggeser sisi persegi panjang berujung silang dari sisi ke sisi dan menggeser sisi bawah persegi panjang sisi-ke-sisi dan mungkin mengubah lebarnya. Jika kita melakukan ini sehingga 80% dari persegi panjang berwarna tetap menetas silang, perubahan semacam itu tidak akan mengubah informasi yang disebutkan, namun itu dapat mengubah proporsi wanita di persegi panjang kanan atas. Jelas proporsinya bisa di mana saja antara 0% dan 100% dan masih konsisten dengan informasi yang diberikan, seperti pada gambar ini:

Gambar 2


Salah satu kekuatan metode ini adalah ia menetapkan keberadaan beberapa jawaban untuk pertanyaan itu. Seseorang dapat menerjemahkan semua ini secara aljabar dan, dengan cara menetapkan probabilitas, menawarkan situasi tertentu sebagai contoh yang mungkin, tetapi kemudian pertanyaan akan muncul apakah contoh seperti itu benar-benar konsisten dengan data. Misalnya, jika seseorang menyarankan bahwa mungkin 50% dari orang berambut panjang adalah AX3, pada awalnya tidak jelas bahwa ini bahkan mungkin dilakukan mengingat semua informasi yang tersedia. Diagram (Venn) populasi dan subkelompoknya memperjelas hal tersebut.


3
Whuber, dengan anggapan bahwa golongan darah dan panjang rambut independen, maka tentunya porsi wanita berambut panjang dengan tipe AX3 harus sama dengan porsi wanita berambut pendek dengan AX3? Jika Anda tidak memiliki fleksibilitas untuk mengubah persegi panjang dengan cara yang Anda usulkan ... Jika kami juga berasumsi bahwa pria dan wanita adalah 50:50 di seluruh populasi, bukankah itu memberi kami cukup info untuk menyelesaikan pertanyaan ini dengan satu jawaban yang tak terbantahkan?
Mungkin

@whuber +1 sangat bagus.
Michael R. Chernick

5
Mungkin salah, perhatikan pertanyaan di komentar Anda: karena ini berhubungan dengan wanita , itu membuat asumsi tambahan tentang independensi yang tergantung pada gender. Asumsi kemandirian (tanpa syarat) rambut dan golongan darah tidak menyebutkan jenis kelamin sama sekali, jadi untuk memahami apa artinya, menghapus penetasan silang dari angka-angka. Saya harap, ini menunjukkan mengapa kita memiliki fleksibilitas untuk menempatkan penetasan silang di mana pun kita suka dalam persegi panjang atas dan bawah.
whuber

1
@whuber, aku suka ini. Namun, saya punya 2 pertanyaan / klarifikasi: 1. angka-angka tampaknya mengasumsikan proporsi populasi untuk rambut panjang vs pendek (sekitar 6: 4) & ~ AX3 vs AX3 (sekitar 85:15), tetapi ini tidak disebutkan dalam pertanyaan asli atau dibahas dalam penjelasan Anda tentang angka-angka. Saya menduga proporsi pop tidak relevan. Apakah saya benar / dapatkah Anda menjelaskannya dalam penjelasan? 2. Saya pikir situasi ini pada akhirnya bekerja dengan fenomena yang sama dengan Paradox Simpson , hanya dibingkai secara berbeda (seolah-olah muncul pada masalah dari arah lain). Apakah itu penilaian yang adil?
gung - Reinstate Monica

3
@ung, terima kasih telah membuat klarifikasi itu. Angka-angka tentu saja harus mewakili beberapa proporsi agar dapat bekerja sama sekali, tetapi proporsi apa pun yang tidak secara khusus dijabarkan dalam pernyataan masalah bebas untuk bervariasi. (Saya benar-benar membuat gambar sehingga sekitar 50% dari populasi tampak perempuan, mengantisipasi suntingan nanti di mana ini diasumsikan.) Gagasan untuk menerapkan representasi grafis ini untuk memahami Paradox Simpson sangat menarik; Saya pikir itu pantas.
whuber

13

Ini adalah pertanyaan tentang probabilitas kondisional. Anda tahu bahwa orang tersebut memiliki rambut panjang dan tipe darah Ax3. Biarkan A = { 'Orang itu berambut panjang' } Jadi Anda mencari P ( C | A dan B ) . Anda tahu bahwa P ( C | A ) = 0,9 dan P ( C | B ) = 0,8 . Apakah itu cukup untuk menghitung P ( C | A dan B ) ? Misalkan P ( A dan B dan C ) = 0,7

     A={'The person has long hair'}              B={'The person has blood type Ax3'}C={'The person is female'}.

P(C|A and B)P(C|A)=0.9P(C|B)=0.8
P(C|A and B)P(A and B and C)=0.7. Kemudian Misalkan P ( A dan B ) = 0,8 . Kemudian, dengan yang di atas, P ( C | A dan B ) = 0,875
P(C|A and B)=P(A and B and C)/P(A and B)=0.7/P(A and B).
P(A and B)=0.8P(C|A and B)=0.875. Di sisi lain jika maka kita akan memiliki P ( C | A dan B ) = 0,78.P(A and B)=0.9P(C|A and B)

Sekarang keduanya dimungkinkan ketika dan P ( C | B ) = 0,8 . Jadi kita tidak bisa memastikan apa itu P ( C | A dan B ) .P(C|A)=0.9P(C|B)=0.8P(C|A and B)


Hai Michael, Jika saya membacanya dengan benar, Anda mengatakan pertanyaan yang diajukan tidak dapat dijawab, benarkah itu? Atau dengan kata lain, Anda perlu informasi lebih banyak untuk menjawab pertanyaan ini? 1. Mari kita asumsikan bahwa golongan darah langka dalam pertanyaan awal saya tidak berdampak pada keinginan atau kemampuan seseorang untuk menumbuhkan rambut mereka panjang. Bisakah pertanyaan itu dijawab sekarang? 2. Apakah Anda setuju bahwa jawabannya harus LEBIH BESAR dari 0,9? (Karena Anda memiliki informasi independen kedua - golongan darah - yang memperkuat hipotesis bahwa orang tersebut adalah perempuan)
Mungkin

2
Jika independen, maka P ( A  dan  B ) = P ( A ) P ( B ) dan Anda harus menentukan fraksi orang yang memiliki rambut panjang, yaitu P ( A ) dan fraksi apa orang memiliki golongan darah Ax3, yaitu, P ( B ) . Juga, Anda tidak bisa mengatakan bahwa jawabannya harus lebih besar dari 0,9, yang setara dengan menyatakan bahwa P ( C | A  dan  B )P(A and B)P(A and B)=P(A)P(B)P(A)P(B) (Saya benar-benar tidak mengerti mengapa). P(C|A and B)>0.9
Néstor

2
@Mungkin salah. Ya masalah seperti yang dinyatakan sebelumnya memiliki informasi yang tidak memadai untuk jawaban yang unik.
Michael R. Chernick

@ Néstor, Micahael, saya tidak setuju bahwa kita perlu tahu fraksi orang yang berambut panjang, atau fraksi orang mana yang memiliki golongan darah AX3. Saya pikir jawaban untuk pertanyaan awal diselesaikan secara unik tanpa mengetahui ini (dengan asumsi A dan B independen, yang kita semua miliki, dan dengan asumsi kita tahu pemisahan pria dan wanita di seluruh populasi - tidak masuk akal untuk mengira itu sekitar 50:50 , Kupikir).
Mungkin

7
Mengapa Saya pikir P ( C | A B ) = P ( C ( A B ) )
P(C|A and B)=P(A and B and C)×P(A and B)??
menggunakan definisi probabilitas bersyarat.
P(C|AB)=P(C(AB))P(AB)=P(ABC)P(AB)
Dilip Sarwate

4

Diskusi yang menarik! Saya bertanya-tanya apakah kita menentukan P (A) dan P (B) juga apakah rentang P (C | A, B) tidak akan jauh lebih sempit daripada interval penuh [0,1], hanya karena banyaknya kendala kita punya.

Menempel notasi yang diperkenalkan di atas:

A = peristiwa orang tersebut berambut panjang

B = peristiwa orang tersebut memiliki golongan darah AX3

C = acara orang itu adalah wanita

P (C | A) = 0,9

P (C | B) = 0,8

P (C) = 0,5 (yaitu mari kita asumsikan rasio yang sama antara pria dan wanita dalam populasi pada umumnya)

tampaknya tidak mungkin untuk mengasumsikan bahwa peristiwa A dan B bersifat kondisional independen mengingat C! Itu mengarah langsung ke kontradiksi: jika P(AB|C)=P(A|C)P(B|C)=P(C|A)P(A)P(C)P(C|B)P(B)P(C)

kemudian

P(C|AB)=P(AB|C)(P(C)P(AB))=P(C|A)P(A)P(C)P(C|B)P(B)P(C)(P(C)P(AB))

Jika kita sekarang berasumsi bahwa A dan B juga independen: sebagian besar syarat dibatalkan dan kami berakhir denganP(AB)=P(A)P(B)

P(C|AB)=P(C|A)P(C|B)P(C)=0.90.80.5>1

Menindaklanjuti representasi geometris yang luar biasa dari masalah: Walaupun memang benar bahwa secara umum dapat mengasumsikan nilai apa pun dalam interval [ 0 , 1 ] kendala geometrik melakukan mempersempit kisaran nilai yang mungkin secara signifikan untuk nilai-nilai P ( A ) dan P ( B ) yang tidak "terlalu kecil". (Meskipun kita juga bisa membatasi marginal: P ( A ) dan P ( B ) )P(C|AB)[0,1]P(A)P(B)P(A)P(B)

Mari kita hitung {\ bf nilai sekecil mungkin} untuk bawah batasan geometris berikut:P(C|AB)

1. Fraksi area atas (A TRUE) yang dicakup oleh persegi panjang atas harus sama dengan P(C|A)=0.9

2. Jumlah area dari dua persegi panjang harus sama dengan P(C)=0.5

3. Jumlah fraksi dari area dari dua persegi panjang berwarna (yaitu tumpang tindih dengan event B) harus sama dengan P(C|B)=0.8

4. (sepele) Persegi panjang atas tidak dapat dipindahkan melampaui batas kiri dan tidak boleh dipindahkan melampaui batas minimum tumpang tindih ke kiri.

5. (sepele) Kotak lebih rendah tidak dapat dipindahkan melampaui batas kanan dan tidak boleh dipindahkan melebihi batas maksimumnya ke kanan.

P(C|AB)masukkan deskripsi gambar di sini

Berjalan melalui rentang nilai yang mungkin untuk skrip P (A) dan P (B) ( R ) menghasilkan grafik ini masukkan deskripsi gambar di sini

Sebagai kesimpulan, kita dapat menurunkan probabilitas kondisional P (c | A, B) untuk diberikan P (A), P (B)


2
A,B,C

1
@whuber: terima kasih atas komentar yang bermanfaat! Saya berharap suntingan baru membuatnya lebih mudah dibaca dan jelas.
Markus Loecher

@whuber dan yang lainnya: Saya berharap untuk menyalakan kembali diskusi tetapi utasnya tampaknya tidak aktif? Tidak ada lagi komentar oleh siapa pun?
Markus Loecher

1

Buat hipotesisnya adalah bahwa orang di balik tirai adalah wanita.

Kami daerah diberi 2 buah bukti, yaitu:

Bukti 1: Kami tahu orang tersebut memiliki rambut panjang (dan kami diberitahu bahwa 90% dari semua orang dengan rambut panjang adalah perempuan)

Bukti 2: Kami tahu orang tersebut memiliki tipe darah langka AX3 (dan kami diberitahu bahwa 80% dari semua orang dengan tipe darah ini adalah wanita)

Diberikan hanya Bukti 1, kita dapat menyatakan bahwa orang di balik tirai memiliki nilai probabilitas 0,9 untuk menjadi seorang wanita (dengan asumsi 50:50 memisahkan antara pria dan wanita).

Mengenai pertanyaan yang diajukan sebelumnya di utas, yaitu "Apakah Anda setuju bahwa jawabannya harus LEBIH DARI 0,9?", Tanpa melakukan Matematika, saya akan mengatakan secara intuitif, jawabannya harus "ya" (itu LEBIH BESAR dari 0,9). Logikanya adalah bahwa Bukti 2 adalah bukti pendukung (sekali lagi, dengan asumsi 50:50 untuk jumlah pria dan wanita di dunia). Jika kami diberitahu bahwa 50% dari semua orang dengan darah tipe AX3 adalah wanita, maka Bukti 2 akan menjadi netral dan tidak memiliki kaitan. Tetapi karena kita diberitahu bahwa 80% dari semua orang dengan golongan darah ini adalah perempuan, Bukti 2 adalah bukti pendukung dan secara logis harus mendorong probabilitas akhir seorang wanita di atas 0,9.

Untuk menghitung probabilitas tertentu, kita dapat menerapkan aturan Bayes untuk Bukti 1 dan kemudian menggunakan pembaruan Bayesian untuk menerapkan Bukti 2 pada hipotesis baru.

Seharusnya:

A = peristiwa orang tersebut berambut panjang

B = peristiwa orang tersebut memiliki golongan darah AX3

C = peristiwa orang itu perempuan (anggap 50%)

Menerapkan aturan Bayes ke Bukti 1:

P (C | A) = (P (A | C) * P (C)) / P (A)

Dalam hal ini, sekali lagi jika kita mengasumsikan pembagian 50:50 antara pria dan wanita:

P (A) = (0,5 * 0,9) + (0,5 * 0,1) = 0,5

Jadi, P (C | A) = (0,9 * 0,5) / 0,5 = 0,9 (Tidak mengherankan, tetapi akan berbeda jika kita tidak memiliki 50:50 antara pria dan wanita)

Menggunakan pembaruan Bayesian untuk menerapkan Bukti 2 dan menghubungkan 0,9 sebagai probabilitas sebelumnya yang baru, kami memiliki:

P (C | A AND B) = (P (B | C) * 0.9) / P (E)

Di sini, P (E) adalah probabilitas Bukti 2, mengingat hipotesis bahwa orang tersebut sudah memiliki peluang 90% untuk menjadi perempuan.

P (E) = (0,9 * 0,8) + (0,1 * 0,2) [ini adalah hukum probabilitas total: (P (wanita) * P (AX3 | wanita) + P (pria) * P (AX3 | pria)] Jadi , P (E) = 0,74

Jadi, P (C | A AND B) = (0,8 * 0,9) / 0,74 = 0,97297


1
Ada beberapa pernyataan dalam jawaban Anda yang tidak masuk akal bagi saya. (1) P (C | A) = 0,9 dengan asumsi. Tidak ada yang mengatakan bahwa P (C) = 0,9. Kami mengasumsikan P (C) = 0,5. (2) Bagaimana Anda mendapatkan hasil untuk P (E)? P (wanita) = P (pria) = 0,5 dengan asumsi di mana Anda menulis P (wanita) = 0,9.
Michael R. Chernick

Nilai P (C) diasumsikan 0,5, yang telah saya gunakan. Nilai untuk P (E) adalah probabilitas Bukti 2 setelah menerapkan Bukti 1 (yang mengarah pada hipotesis baru bahwa probabilitas bahwa orang tersebut adalah perempuan adalah 0,9). P (E) = (probabilitas bahwa orang tersebut adalah perempuan (diberikan bukti 1) * probabilitas orang tersebut memiliki AX3 jika perempuan) + (probabilitas bahwa orang tersebut adalah laki-laki (diberikan bukti 1) * probabilitas orang tersebut memiliki AX3 jika seorang pria) = (0,9 * 0,8) + (0,1 * 0,2) = 0,74
RandomAnswer

Definisi Anda tentang probabilitas E agak membingungkan dan istilah yang Anda gunakan untuk menghitungnya terlihat berbeda dari apa yang Anda tulis sebelumnya. Itu sebenarnya tidak masalah. Jawabannya ternyata benar berdasarkan jawaban Huu yang disajikan dengan baik.
Michael R. Chernick

@Michael Kecuali tampaknya Huu melakukan kesalahan.
whuber

2
Jawaban ini benar-benar salah. Mungkin ada kesalahan lain, tapi yang ini mencolok. Anda menyatakan jawaban definitif untuk P ("Memiliki Rambut Panjang") (P (A)) Anda, dan kemudian menggunakannya untuk memberikan jawaban definitif akhir Anda. Tidak ada cukup informasi untuk menentukan ini, bahkan dengan asumsi P (F) = 0,5. Baris Anda untuk menghitung P (A) tampaknya datang entah dari mana. Berikut adalah rumus yang benar menggunakan Bayes theroem: P (A) = P (A | F) P (F) / P (F | A) yang darinya, dengan menggunakan asumsi yang Anda nyatakan, dapatkan ke P (A) = P (A | F) * 5/9. Namun kita masih belum tahu P (A | F), yang bisa berupa apa saja.
Bogdanovist

0

Penyajian Kembali Pertanyaan dan Generalisasi

ABC01ZiZi(X|Y)XY(Aa|BbCcI)

  1. (Aa1|Bb1I)=u1(Aa2|Cc2I)=u2
  2. (Aa1|Bb1I)=u1(Aa2|Cc2I)=u2(BC|I)=(B|I)(C|I)
  3. (Aa1|Bb1I)=u1(Aa2|Cc2I)=u2(A0|I)=12
  4. (Aa1|Bb1I)=u1(Aa2|Cc2I)=u2(A0|I)=12(BC|I)=(B|I)(C|I)

I

(BjCk|I)=(Bj|I)(Ck|I),j=0,1k=0,1

Jawaban

Kasus 1

(ABC|I)(ABC|I)

Telah ditunjukkan oleh berbagai cara esoteris bahwa distribusi untuk menetapkan ketika informasi tidak menentukan solusi adalah salah satu yang, dari semua distribusi yang konsisten dengan informasi yang diketahui, memiliki entropi terbesar. Distribusi lain menyiratkan bahwa kita mengetahui lebih dari informasi yang diketahui, yang tentu saja merupakan kontradiksi.

i,j,k(AiBjCk|I)ln(AiBjCk|I)
i,j,k(AiBjCk|I)=1
(Aa1|Bb1I)=u1i.e.k(Aa1Bb1Ck|I)i,k(AiBb1Ck|I)=u1
(Aa2|Cc2I)=u2i.e.j(Aa2BjCc2|I)i,j(AiBjCc2|I)=u2

  1. A1
  2. B1
  3. C1

a=1b=1c=1a1=1b1=1a2=1c2=1u1=0.9u2=0.8(A1|B1C1I)0.932. Oleh karena itu probabilitas bahwa orang di balik tirai adalah perempuan, mengingat bahwa ia memiliki rambut panjang dan golongan darah AX3, adalah 0,932.

Kasus 2

BC

(B0|ClI)=(B0|I),l=0,1
i(AiB0Cl|I)i,j(AiBjCl|I)=i,k(AiB0Ck|I),l=0,1
(A1|B1C1I)0.936 , sehingga probabilitas bahwa orang di belakang tirai adalah perempuan, mengingat bahwa ia / dia memiliki rambut panjang dan golongan darah AX3, adalah 0,936.

Kasus 3

(A0|I)=12i.e.j,k(A0BjCk|I)=12
(A1|B1C1I)0.973 , sehingga kemungkinan orang di balik tirai itu perempuan, mengingat ia memiliki rambut panjang dan tipe darah AX3, adalah 0,973.

Kasus 4

(A1|B1C1I)0.989


-2

Saya percaya sekarang bahwa, jika kita mengasumsikan rasio pria dan wanita dalam populasi pada umumnya, maka ada satu jawaban yang tidak terbantahkan.

A = peristiwa orang tersebut berambut panjang

B = peristiwa orang tersebut memiliki golongan darah AX3

C = acara orang itu adalah wanita

P (C | A) = 0,9

P (C | B) = 0,8

P (C) = 0,5 (yaitu mari kita asumsikan rasio yang sama antara pria dan wanita dalam populasi pada umumnya)

Kemudian P (C | A dan B) = [P (C | A) x P (C | B) / P (C)] / [[P (C | A) x P (C | B) / P (C )] + [[1-P (C | A)] x [1-P (C | B)] / [1-P (C)]]]

dalam hal ini, P (C | A dan B) = 0,972973


P [C | A dan B) = P (A dan B dan C) / P (A dan B) = P (A dan B dan C) / [P (A | B) P (B)]. Bagaimana Anda mendapatkan formula Anda?
Michael R. Chernick

Mungkin ada cara untuk menambahkan kondisi sehingga Anda mendapatkan jawaban yang unik.
Michael R. Chernick

Untuk menambahkan dengan kemandirian A dan B, rumus menyederhanakan menjadi P (A dan B dan C} / [P (A) P (B)] = P (B dan C | A) / P (B)
Michael R. Chernick

2
Maksud pertanyaan saya adalah agar Anda membenarkan formula itu. Saya tidak mengerti bagaimana itu akan diturunkan.
Michael R. Chernick

2
Tidak, jawaban yang seharusnya menggunakan Aturan Bayes salah. Saya tidak yakin mengapa Anda bingung, rumus MC di atas benar dan tidak dapat digunakan untuk mendapatkan hasil apa pun, itulah yang dijelaskan oleh jawaban Whuber dan untuk pertanyaan itu!
Bogdanovist

-2

Catatan: Untuk mendapatkan jawaban yang pasti, jawaban di bawah ini mengasumsikan bahwa probabilitas seseorang, pria berambut panjang, dan wanita berambut panjang yang memiliki AX3 kira-kira sama. Jika lebih banyak keakuratan diinginkan, ini harus diverifikasi.

Anda mulai dengan pengetahuan bahwa orang tersebut memiliki rambut panjang, jadi pada titik ini kemungkinannya adalah:

90:10

Catatan: Rasio pria dan wanita dalam populasi umum tidak masalah bagi kami setelah kami mengetahui bahwa orang tersebut memiliki rambut panjang. Misalnya, jika ada 1 wanita dalam seratus populasi umum, orang berambut panjang yang dipilih secara acak masih akan menjadi wanita 90% dari waktu. Rasio wanita terhadap pria TIDAK penting! (lihat pembaruan di bawah untuk detailnya)

Selanjutnya, kita mengetahui bahwa orang tersebut memiliki AX3. Karena AX3 tidak terkait dengan rambut panjang, rasio pria dan wanita diketahui 50:50, dan karena asumsi kami tentang probabilitas yang sama, kami hanya dapat melipatgandakan setiap sisi dari probabilitas dan menormalkan sehingga jumlah dari sisi-sisi probabilitas sama dengan 100:

(90:10) * (80:20)
==> 7200:200

    Normalize by dividing each side by (7200+200)/100 = 74

==> 7200/74:200/74
==> 97.297.. : 2.702..

Dengan demikian, kemungkinan orang di balik tirai adalah perempuan adalah sekitar 97,297%.

MEMPERBARUI

Berikut ini eksplorasi lebih lanjut dari masalahnya:

Definisi:

f - number of females
m - number of males
fl - number of females with long hair
ml - number of males with long hair
fx - number of females with AX3
mx - number of males with AX3
flx - number of females with long hair and AX3
mlx - number of males with long hair and AX3
pfl - probability that a female has long hair
pml - probability that a male has long hair
pfx - probability that a female has AX3
pmx - probability that a male has AX3

Pertama, kita diberi tahu bahwa 90% orang berambut panjang adalah wanita, dan 80% orang dengan AX3 adalah wanita, jadi:

fl = 9 * ml
pfl = fl / f
pml = ml / m 
    = fl / (9 * m)

fx = 4 * mx
pfx = fx / f
pmx = mx / m 
    = fx / (4 * m)

Karena kami berasumsi bahwa probabilitas AX3 tidak tergantung pada jenis kelamin dan rambut panjang, pfx kami yang dihitung akan berlaku untuk wanita dengan rambut panjang, dan pmx akan berlaku untuk pria dengan rambut panjang untuk menemukan jumlah mereka yang mungkin memiliki AX3:

flx = fl * pfx 
    = fl * (fx / f) 
    = (fl * fx) / f
mlx = ml * pmx 
    = (fl / 9) * (fx / (4 * m)) 
    = (fl * fx) / (36 * m)

Dengan demikian, rasio kemungkinan jumlah perempuan dengan rambut panjang dan AX3 dengan jumlah laki-laki dengan rambut panjang dan AX3 adalah:

flx             :   mlx
(fl * fx) / f   :   (fl * fx) / (36 * m)
1/f             :   1 / (36m)
36m             :   f

Karena diberi jumlah yang sama yaitu 50:50, Anda dapat membatalkan kedua sisi dan mengakhiri dengan 36 wanita untuk setiap pria. Jika tidak, ada 36 * m / f wanita untuk setiap pria di subkelompok yang ditentukan. Misalnya, jika ada dua kali lebih banyak perempuan daripada laki-laki, akan ada 72 perempuan untuk setiap laki-laki dari mereka yang berambut panjang dan AX3.


1
Solusi ini bergantung pada asumsi lebih dari yang saat ini dinyatakan dalam masalah: yaitu, bahwa rambut panjang, AX3, dan jenis kelamin adalah independen. Kalau tidak, Anda tidak bisa membenarkan "menerapkan" pfx pada wanita berambut panjang, dll.
whuber

@whuber: Ya, saya membuat asumsi itu. Namun, bukankah tujuan probabilitas untuk memberikan perkiraan terbaik berdasarkan data yang Anda miliki? Jadi, karena Anda sudah tahu bahwa rambut panjang dan AX3 independen untuk populasi umum, Anda HARUS meneruskan asumsi itu kepada pria dan wanita sampai Anda secara eksplisit belajar sebaliknya. Memang, ini bukan yang benar secara universal, tetapi ini adalah yang terbaik yang dapat Anda lakukan sampai Anda mendapatkan lebih banyak info. T: Dengan hanya data saat ini, jika Anda harus memberikan% peluang bahwa itu adalah seorang wanita di balik tirai, apakah Anda benar-benar akan mengatakan "antara 0 dan 100%"?
Briguy37

1
Kami memiliki perbedaan penting dalam filosofi, @Briguy. Saya sangat percaya tidak membuat asumsi yang tidak berdasar. Tidak jelas dalam hal apa asumsi kemandirian bersama adalah "terbaik": Saya akan mengabulkannya dalam aplikasi tertentu. Tetapi secara umum, itu tampak berbahaya bagi saya. Saya lebih suka memperjelas asumsi yang dibutuhkan untuk menyelesaikan masalah, sehingga orang dapat memutuskan apakah perlu mengumpulkan data untuk memeriksa asumsi tersebut, daripada mengasumsikan hal-hal yang secara matematis nyaman untuk mendapatkan jawaban. Itulah perbedaan antara statistik dan matematika.
whuber

Untuk menjawab pertanyaan Anda: ya, 0% - 100% persis jawaban yang akan saya berikan. (Saya telah memberikan jawaban serupa untuk pertanyaan yang sebanding di situs ini.) Kisaran itu secara akurat mencerminkan ketidakpastian. Masalah ini terkait erat dengan paradoks Ellsberg . Makalah asli Ellsberg ditulis dengan baik dan jelas: Saya merekomendasikannya.
whuber

@whuber: Terima kasih telah meluangkan waktu untuk berdialog dengan saya. Saya melihat poin Anda tentang pentingnya memikirkan dan mendaftarkan asumsi yang dibuat, dan telah memperbarui jawaban saya. Namun, sehubungan dengan jawaban Anda, saya percaya itu tidak lengkap. Alasan untuk ini adalah bahwa Anda dapat mempertimbangkan semua kasus yang tidak diketahui dan menemukan probabilitas rata-rata dari semuanya untuk sampai pada jawaban akhir Anda. EG Meskipun keduanya masih mungkin, probabilitas di atas 50% jauh lebih umum daripada probabilitas di bawah 50% di semua kasus, jadi kita tentu lebih baik menebak bahwa itu adalah seorang wanita.
Briguy37

-4

98% Wanita, interpolasi sederhana. Premis pertama 90% betina, daun 10%, premis kedua hanya menyisakan 2% dari 10% yang ada, karenanya 98% betina

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.