Bayesian Networks (BN's) adalah model generatif. Asumsikan Anda memiliki satu set input, , dan output . BN memungkinkan Anda untuk mempelajari distribusi gabungan , sebagai lawan dari katakanlah regresi logistik atau Support Vector Machine, yang memodelkan distribusi bersyarat .Y P ( X , Y ) P ( Y | X )XYP(X,Y)P(Y|X)
Mempelajari distribusi probabilitas gabungan (model generatif) data lebih sulit daripada mempelajari probabilitas kondisional (model diskriminatif). Namun, yang pertama menyediakan model yang lebih fleksibel di mana Anda dapat menjalankan kueri seperti atau , dll. Dengan model diskriminatif, satu-satunya tujuan Anda adalah untuk mempelajari .P ( X 1 | X 2 = A , X 3 = B ) P ( Y | X )P(X1|Y)P(X1|X2=A,X3=B)P(Y|X)
BN menggunakan DAG untuk meresepkan distribusi bersama. Karenanya mereka adalah model grafis.
Keuntungan:
Ketika Anda memiliki banyak data yang hilang, misalnya dalam kedokteran, BN's bisa sangat efektif sejak memodelkan distribusi bersama (yaitu pernyataan Anda tentang bagaimana data dihasilkan) mengurangi ketergantungan Anda dalam memiliki dataset yang teramati sepenuhnya.
Saat Anda ingin memodelkan suatu domain dengan cara yang transparan secara visual, dan juga bertujuan untuk menangkap hubungan , BN's bisa sangat kuat. Perhatikan bahwa asumsi kausalitas dalam BN's terbuka untuk diperdebatkan.cause→effect
Mempelajari distribusi bersama adalah tugas yang sulit, memodelkannya untuk variabel diskrit (melalui perhitungan tabel probabilitas bersyarat, yaitu CPT) jauh lebih mudah daripada mencoba melakukan hal yang sama untuk variabel kontinu. Jadi BN praktis lebih umum dengan variabel diskrit.
BN tidak hanya memungkinkan inferensi observasional (seperti semua model pembelajaran mesin memungkinkan) tetapi juga intervensi kausal s. Ini adalah keuntungan BN yang sering diabaikan dan kurang dihargai dan terkait dengan alasan kontrafaktual.