Apa intuisi di balik rumus untuk probabilitas bersyarat?


30

Rumus untuk probabilitas bersyarat dari terjadi mengingat bahwa telah terjadi adalah:B P ( AAB

P(A | B)=P(AB)P(B).

Buku teks saya menjelaskan intuisi di balik ini dalam hal diagram Venn.

masukkan deskripsi gambar di sini

Mengingat bahwa telah terjadi, satu-satunya cara untuk terjadi adalah untuk peristiwa jatuh di persimpangan dan .A A BBAAB

Dalam hal itu, bukankah probabilitas sama dengan probabilitas persimpangan , karena itulah satu-satunya cara peristiwa itu bisa terjadi? Apa yang saya lewatkan? A BP(A|B)AB


7
Apakah Anda memiliki pemahaman intuitif tentang apa probabilitas kondisional "adalah", jika kita lupa sebentar bagaimana cara menghitungnya?
Juho Kokkala

4
Dengan mengkondisikan pada B (peristiwa yang telah terjadi), Anda membatasi ruang hasil Anda dari (seluruh bidang) hanya untuk B. Anda lupa semua yang ada di luar B. Probabilitas peristiwa A harus diukur dengan menghormati B, karena probabilitasnya antara 0 dan 1.Ω
Vladislavs Dovgalecs

1
Anda kehilangan fakta bahwa bagian putih dari lingkaran A Event tidak lagi menjadi bagian dari populasi begitu Anda tahu Event B terjadi.
Monty Harder

4
Intuisi tidak tepat, juga tidak singular, jadi mengapa bertanya tentang intuisi yang tepat (tunggal)? Intuisi yang berguna sudah mencukupi, tetapi tidak semua saran akan berguna bagi semua orang.
John Coleman

Jawaban:


23

Intuisi yang baik diberikan bahwa B terjadi — dengan atau tanpa A — berapakah probabilitas A? Yaitu, kita sekarang berada di alam semesta tempat B terjadi — lingkaran kanan penuh. Dalam lingkaran itu, probabilitas A adalah luas A berpotongan B dibagi dengan luas lingkaran.


5
Dengan kata lain - saya katakan terjadi, yang berarti kita hidup dalam lingkaranDalam dunia itu, berapa% peristiwa yang ada dalam lensa ( )? B A BBBAB
MichaelChirico

18

Saya akan berpikir seperti ini: Saya menerima begitu saja bahwa Anda memahami intuisi sampai:

Mengingat bahwa B telah terjadi, satu-satunya cara agar A terjadi adalah untuk jatuh secara merata di persimpangan A& B.

dan saya akan mengomentari gambar kedua yang Anda poskan:

  1. Bayangkan bahwa seluruh persegi panjang putih adalah ruang sampel Anda .Ω

    Menetapkan probabilitas ke set berarti bahwa Anda mengukur dalam arti bahwa set. Itu sama seperti jika Anda mengukur luas persegi panjang tetapi kemungkinannya adalah ukuran yang berbeda yang memiliki sifat spesifik (saya tidak akan mengatakan apa-apa lagi tentang ini).

  2. Anda tahu bahwa dan ini ditafsirkan seperti ini:P(Ω)=1

    Ω mewakili semua peristiwa yang dapat terjadi dan sesuatu harus terjadi sehingga kami memiliki 100% probabilitas bahwa sesuatu terjadi.

  3. Secara analog set memiliki probabilitas yang sebanding dengan probabilitas ruang sampel . Secara grafis Anda melihat bahwa maka ukuran (probabilitasnya ) harus lebih rendah dari . Alasan yang sama berlaku untuk set . Set ini dapat diukur dan ukurannya adalah .P ( A ) Ω A Ω A P ( A ) P ( Ω ) A B P ( A B )AP(A)ΩAΩAP(A)P(Ω)ABP(AB)

  4. Jika sekarang Anda diberitahu bahwa telah terjadi, Anda harus berpikir seolah-olah adalah " " baru Anda . Jika adalah Anda "baru" maka Anda bisa 100% yakin bahwa segala sesuatu terjadi di set .B Ω B Ω BBBΩBΩB

    Dan apa artinya itu? Ini berarti bahwa sekarang, dalam kontes "baru" , dan Anda harus mengubah skala semua ukuran probabilitas, dengan mempertimbangkan bahwa mereka harus dinyatakan dalam ruang sampel "baru" . Ini adalah proporsi yang sederhana.BP(BB)=1B

    Intuisi Anda hampir benar ketika Anda mengatakan itu:

probabilitas P (A | B) akan sama dengan probabilitas persimpangan A B

dan "hampir" disebabkan oleh fakta bahwa sekarang ruang sampel Anda telah berubah ( sekarang sekarang) dan Anda ingin mengubah skala .P ( A B )BP(AB)

  1. P ( A B ) BP(AB) adalah Anda di dunia baru di mana ruang sampel sekarang . Dengan kata-kata Anda akan mengatakannya seperti ini (dan silakan coba memvisualisasikannya pada gambar dengan set):P(AB)B

    Di dunia baru rasio antara ukuran dan ukuran harus sama dengan rasio antara ukuran dan ukuranA B Ω A BBABΩAB

  2. Terakhir terjemahkan ini dalam bahasa matematika (proporsi sederhana):

P(B):P(AB)=P(Ω):P(AB)

dan karena maka berikut:P(Ω)=1

P(AB)=P(AB):P(B)

5

Anda akan melihat intuisi dengan mudah memikirkan masalah berikut.

Misalkan, Anda memiliki 10 bola: 6 Hitam dan 4 merah. Bola Hitam 3 Luar Biasa dan bola merah hanya 1 Luar Biasa. Seberapa besar kemungkinannya bahwa bola hitam juga Keren?

Jawabannya sangat mudah: ini 50%, karena kami memiliki 3 bola Hitam Luar Biasa dari total 6 bola Hitam.

Ini adalah cara Anda memetakan probabilitas untuk masalah kami:

  • 3 bola yang Hitam DAN Luar Biasa sesuai denganP(AB)
  • 6 bola Hitam berkorespondensi denganP(B)
  • probabilitas bahwa bola itu Keren ketika kami TAHU itu adalah Hitam:P(AB)

1
Tidakkah lebih masuk akal untuk menulis daripada ? n(B)=6P(B)=6
Silverfish

@Silverfish Akan lebih akurat, tapi saya setelah intuisi dalam kasus ini
Aksakal

4

Untuk intuisi dasar rumus probabilitas bersyarat, saya selalu suka menggunakan tabel dua arah. Katakanlah ada 150 siswa dalam kelompok tahun, 80 di antaranya perempuan dan 70 laki-laki, masing-masing harus belajar persis satu kursus bahasa. Tabel dua arah siswa yang mengambil kursus berbeda adalah:

        | French   German   Italian  | Total
-------- --------------------------- -------
Male    |     30       20        20  |    70
Female  |     25       15        40  |    80
-------- --------------------------- -------
Total   |     55       35        60  |   150

Mengingat bahwa seorang siswa mengambil kursus bahasa Italia, berapa probabilitas mereka perempuan? Ya kursus bahasa Italia ini memiliki 60 siswa, 40 di antaranya perempuan belajar bahasa Italia, jadi kemungkinannya adalah:

P(F|Italian)=n(FItalian)n(Italian)=4060=23

di mana adalah kardinalitas himpunan , yaitu jumlah item yang dikandungnya. Perhatikan bahwa kami perlu menggunakan dalam pembilang dan bukan hanya , karena yang terakhir akan mencakup semua 80 wanita, termasuk 40 lainnya. yang tidak belajar bahasa Italia.n(A)An(FItalian)n(F)

Tetapi jika pertanyaan itu dibalikkan, berapakah probabilitas seorang siswa mengambil kursus bahasa Italia, mengingat mereka adalah perempuan? Kemudian 40 dari 80 siswa perempuan mengikuti kursus bahasa Italia, jadi kami memiliki:

P(Italian|F)=n(ItalianF)n(F)=4080=12

Saya harap ini memberikan intuisi mengapa

P(A|B)=n(AB)n(B)

Memahami mengapa pecahan dapat ditulis dengan probabilitas alih-alih kardinalitas adalah masalah pecahan yang setara . Sebagai contoh, mari kita kembali ke probabilitas seorang siswa perempuan mengingat mereka sedang belajar bahasa Italia. Ada 150 siswa secara total, sehingga probabilitas bahwa seorang siswa adalah perempuan dan belajar bahasa Italia adalah 40/150 (ini adalah probabilitas "bersama") dan probabilitas seorang siswa mempelajari bahasa Italia adalah 60/150 (ini adalah probabilitas "marjinal" ). Perhatikan bahwa membagi probabilitas gabungan dengan probabilitas marginal menghasilkan:

P(FItalian)P(Italian)=40/15060/150=4060=n(FItalian)n(Italian)=P(F|Italian)

(Untuk melihat bahwa pecahannya sama, mengalikan pembilang dan penyebut dengan 150 menghilangkan "/ 150" di masing-masing.)

Lebih umum, jika ruang sampling Anda memiliki kardinalitas - dalam contoh ini kardinalitasnya 150 - kami menemukan bahwaΩn(Ω)

P(A|B)=n(AB)n(B)=n(AB)/n(Ω)n(B)/n(Ω)=P(AB)P(B)

3

Saya akan membalikkan logika. Probabilitas bahwa dan adalah:AB

  1. Probabilitas terjadi, dan mengingat bahwa terjadi.BA
  2. Peran yang sama tetapi terbalik untuk danAB

Ini akan memberimu

p(AB)=p(B)p(AB)

Jika Anda mencari yang negatif terhadap saran Anda, memang benar probabilitas diberikan terkandung dalam probabilitas produk, ruang tempat Anda menggulirkan dadu lebih kecil daripada ruang probabilitas asli Anda - Anda tahu pasti Anda "di" , maka Anda membagi dengan ukuran ruang baru.ABB


2

Diagram Venn tidak mewakili probabilitas, itu mewakili ukuran himpunan bagian dari ruang acara. Probabilitas adalah rasio antara dua ukuran; probabilitas X adalah ukuran "segala sesuatu yang membentuk X" membagi ukuran "semua peristiwa yang dipertimbangkan". Setiap kali Anda menghitung probabilitas, Anda membutuhkan "ruang keberhasilan" dan "ruang populasi". Anda tidak dapat menghitung probabilitas berdasarkan pada seberapa besar ruang keberhasilannya. Misalnya, kemungkinan menggulirkan tujuh dengan dua dadu adalah jumlah cara menggulirkan tujuh dibagi dengan jumlah total cara menggulirkan dua dadu. Hanya dengan mengetahui jumlah cara untuk memutar tujuh tidak cukup untuk menghitung probabilitas. P (A | B) adalah rasio ukuran "baik A dan B terjadi" ruang dan ukuran ruang "B terjadi". Itulah yang "|" berarti: itu berarti "membuat apa yang muncul setelah ini ruang populasi".


2

Saya pikir cara terbaik untuk memikirkan hal ini adalah menggambar jalur langkah demi langkah.

Mari kita gambarkan Event B sebagai menggulung pada dadu yang adil - ini dapat dengan mudah terbukti memiliki probabilitas . Sekarang mari kita gambarkan Event A sebagai menggambar Ace dari setumpuk kartu standar 52 kartu - ini dapat dengan mudah terbukti memiliki probabilitas .416113

Sekarang mari kita jalankan percobaan di mana kita melempar dadu dan kemudian mengambil kartu. Jadi akan menjadi probabilitas bahwa kita menggambar Ace, mengingat bahwa kita telah menggulung . Jika Anda melihat gambar, ini akan menjadi jalur (naik) dan kemudian jalur (naik lagi).P(A|B)416113

Secara intuitif, ruang probabilitas keseluruhan adalah apa yang kita telah diberikan: menggulirkan . Kita dapat mengabaikan dan jalan turun awal mengarah ke, karena itu DIBERIKAN bahwa kita menggulung . Dengan hukum penggandaan, total ruang kita kemudian .411312134(16×113)+(16×1213)

Sekarang berapa probabilitas kita menggambar Ace, DIBERIKAN bahwa kita menggulung ? Jawaban dengan menggunakan path adalah , yang kemudian perlu kita bagi dengan total ruang. Jadi kita mendapatkan4(16×113)

P(A|B)=16×113(16×113)+(16×1213).

masukkan deskripsi gambar di sini


2
Saya bertanya-tanya untuk apa downvote itu, karena pohon probabilitas bisa sangat instruktif. Mungkin yang menjadi perhatian adalah bahwa menggunakan peristiwa independen untuk ilustrasi melewatkan titik probabilitas kondisional, yaitu distribusi probabilitas dapat berubah tergantung pada peristiwa pengkondisian. Menggunakan ilustrasi yang kurang dangkal dapat membantu.
whuber

1

Pikirkan itu dalam hal jumlah. Probabilitas marjinal adalah berapa kali A terjadi dibagi dengan ukuran sampel. Probabilitas gabungan dari A dan B adalah berapa kali A terjadi bersamaan dengan B dibagi dengan ukuran sampel. Probabilitas kondisional dari A yang diberikan B adalah berapa kali A terjadi bersama dengan B dibagi dengan berapa kali B terjadi, yaitu hanya A yang "dalam" B's.

Anda dapat menemukan ilustrasi visual yang bagus di blog ini , yang menunjukkannya menggunakan blok Lego.


1

Pada saat penulisan ini, ada sekitar 10 jawaban yang sepertinya semuanya kehilangan poin terpenting: Anda pada dasarnya benar.

Dalam hal itu, bukankah probabilitas P (A | B) sama dengan probabilitas persimpangan A, karena itu satu-satunya cara peristiwa itu bisa terjadi?

Ini memang benar. Ini menjelaskan mengapa kuantitas yang kita definisikan sebenarnya dihitung ulang.P(A|B)P(AB)

Apa yang saya lewatkan?

Anda kehilangan bahwa probabilitas B dipenuhi mengingat B puas adalah 1 karena ini adalah peristiwa tertentu, dan bukan yang bisa kurang dari 1. Dibagi dengan membuat probabilitas bersyarat B yang diberikan B sama dengan 1, seperti yang diharapkan. Sebenarnya ini bahkan lebih baik dan membuat peta probabilitas - jadi probabilitas bersyarat sebenarnya adalah probabilitas.P(BB)=P(B)P(B)AP(A|B)


0

Saya merasa ini lebih intuitif ketika kita memiliki data konkret untuk memperkirakan probabilitas.

Mari kita gunakan mtcarsdata sebagai contoh, data terlihat seperti ini (kami hanya menggunakan jumlah silinder dan tipe transmisi.)

> mtcars[,c("am","cyl")]
                    am cyl
Mazda RX4            1   6
Mazda RX4 Wag        1   6
Datsun 710           1   4
Hornet 4 Drive       0   6
...  
...
Ford Pantera L       1   8
Ferrari Dino         1   6
Maserati Bora        1   8
Volvo 142E           1   4

Kita dapat menghitung distribusi bersama pada dua variabel dengan melakukan tabel silang:

> prop.table(table(mtcars$cyl,mtcars$am))

          0       1
  4 0.09375 0.25000
  6 0.12500 0.09375
  8 0.37500 0.06250

Probabilitas gabungan berarti kita ingin mempertimbangkan dua variabel secara bersamaan. Sebagai contoh, kami akan bertanya berapa banyak mobil yang 4 silinder dan transmisi manual.

Sekarang, kita sampai pada probabilitas bersyarat. Saya menemukan cara paling intuitif untuk menjelaskan probabilitas bersyarat adalah menggunakan istilah penyaringan pada data.

Misalkan kita ingin mendapatkan , kami akan melakukan estimasi berikut:P(am=1|cyl=4)

> cyl_4_cars=subset(mtcars, cyl==4)
> prop.table(table(cyl_4_cars$am))

        0         1 
0.2727273 0.7272727 

Ini artinya, kita hanya peduli mobil yang punya 4 silinder. Jadi kami memfilter data itu. Setelah penyaringan, kami memeriksa berapa banyak dari mereka adalah transmisi manual.

Anda dapat membandingkan persyaratan ini dengan sambungan yang saya sebutkan sebelumnya untuk merasakan perbedaannya.


0

Jika Aada superset dari Bprobabilitas yang Aterjadi selalu 1 mengingat yang Bterjadi, yaitu P(A|B) = 1. Namun, Bitu sendiri mungkin memiliki probabilitas jauh lebih kecil dari 1.

Perhatikan contoh berikut:

  • diberikan xadalah bilangan alami di 1..100,
  • Aadalah ' xadalah bilangan genap'
  • Bis ' xhabis dibagi oleh 10'

kita kemudian memiliki:

  • P(A) adalah 0,5
  • P(B) adalah 0,1

Jika kita tahu bahwa xitu dapat dibagi dengan 10 (yaitu xdi dalam B) kita tahu bahwa itu juga merupakan bilangan genap (yaitu xdi dalam A) jadi P(A|B) = 1.

Dari aturan Bayes kami memiliki:

P(A|B)=P(AB)P(B)

perhatikan bahwa dalam kasus kami (khusus) , yaitu probabilitas bahwa bilangan genap dan bilangan yang dapat dibagi 10 sama dengan probabilitas bilangan yang dapat dibagi dengan 10. Oleh karena itu, kami memiliki dan menghubungkan ini kembali ke aturan Bayes kita mendapatkan .P(AB)xxP(AB)=P(B)P(A|B)=P(B)/P(B)=1


Untuk contoh non-degenerasi, anggap eg Aadalah ' xhabis dibagi 7' dan B' xhabis dibagi 3'. Kemudian P(A|B)sama dengan 'mengingat bahwa kita tahu bahwa xdapat dibagi oleh 3 berapa probabilitas bahwa itu (juga) dapat dibagi dengan 7?'. Atau dengan kata lain 'Fraksi apa dari angka 3, 6, ..., 99 yang dapat dibagi dengan 7'?


0

Saya pikir pernyataan awal Anda mungkin salah paham.

Kau menulis:

Rumus untuk probabilitas bersyarat dari A terjadi, setelah B terjadi adalah:

Dari ungkapan Anda, mungkin terdengar seolah-olah ada 2 peristiwa "Pertama B terjadi, dan kemudian kami ingin menghitung probabilitas bahwa A akan terjadi".

Ini bukan kasusnya. (Berikut ini valid apakah ada kesalahpahaman atau tidak).

Kami hanya memiliki 1 acara, yang dijelaskan oleh salah satu dari 4 kemungkinan:

  1. bukan atau ;AB

  2. hanya , bukan ;AB

  3. hanya , bukan ;BA

  4. baik dan .AB

Meletakkan beberapa contoh angka di atasnya, katakanlah

P(A)=0.5,P(B)=0.5,andA and B are independent.

Oleh karena itu

P(A and B)=0.25andP(neither A nor B)=0.25.

Awalnya (tanpa pengetahuan tentang acara), kami tahu .P(AB)=0.25

Tetapi begitu kita tahu bahwa telah terjadi, kita berada di ruang yang berbeda. adalah setengah dari sehingga probabilitas diberikan , , adalah . Ini bukan , mengetahui bahwa telah terjadi.BP(AB)P(B)ABP(A|B)0.50.25B


0

Probabilitas pengkondisian TIDAK sama dengan probabilitas persimpangan. Inilah jawaban yang intuitif:

1) : "Kita tahu bahwa terjadi. Berapa probabilitas bahwa akan terjadi?"P(BA)AB

2: : "Kami tidak tahu apakah atau benar-benar terjadi. Berapa probabilitas keduanya akan terjadi?P(AB)AB

Perbedaannya adalah bahwa pada yang pertama, kami memiliki informasi tambahan (kami tahu bahwa terjadi lebih dulu). Yang kedua kita tidak tahu apa-apa.A

Memulai dengan probabilitas yang kedua, kita dapat menyimpulkan probabilitas yang pertama.

Kejadian dan akan terjadi dapat terjadi dalam dua cara:AB

1) Probabilitas DAN probabilitas mengingat bahwa terjadi.ABA

2) Probabilitas DAN probabilitas mengingat bahwa terjadi.BAB

Ternyata kedua situasi sama-sama suka terjadi. (Saya sendiri tidak dapat menemukan alasan intuitifnya). Jadi kita harus mempertimbangkan kedua skenario dengan0.5

P(AB)=1/2P(A(BA))+1/2P(B(AB))

Sekarang gunakan dan independen dan ingat bahwa kedua skenario sama-sama mungkin terjadi.ABA

P(AB)=P(A)P(BA)

Tadaaa ... sekarang mengisolasi kemungkinan pengkondisian!

btw. Saya akan senang jika seseorang dapat menjelaskan mengapa skenario 1 dan 2 sama. Kuncinya ada di sana imo.

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.