Apakah arah tepi pada Bayes Network tidak relevan?


10

Hari ini, dalam sebuah ceramah dikatakan bahwa arah tepi dalam jaringan Bayes tidak terlalu penting. Mereka tidak harus mewakili kausalitas.

Jelas bahwa Anda tidak dapat mengganti satu pun tepi di jaringan Bayes. Misalnya, mari dengan dan . Jika Anda akan beralih ke , maka tidak lagi bersifat acyclical dan karenanya bukan jaringan Bayes. Ini tampaknya terutama masalah praktis bagaimana memperkirakan probabilitas itu. Kasus ini sepertinya jauh lebih sulit untuk dijawab, jadi saya akan melewatkannya.V = { v 1 , v 2 , v 3 } E = { ( v 1 , v 2 ) , ( v 1 , v 3 ) , ( v 2 , v 3 ) } ( v 1 , v 3 ) ( v 3 , v 1 ) GG=(V,E)V={v1,v2,v3}E={(v1,v2),(v1,v3),(v2,v3)}(v1,v3)(v3,v1)G

Ini membuat saya mengajukan pertanyaan-pertanyaan berikut yang saya harap dapat memperoleh jawaban di sini:

  1. Apakah mungkin untuk grafik asiklikal yang diarahkan (DAG) untuk membalik semua tepi dan masih memiliki DAG?
  2. Asumsikan DAG dan data diberikan. Sekarang kami membuat DAG terbalik . Untuk kedua DAG, kami memasukkan data ke jaringan Bayes yang sesuai. Sekarang kami memiliki satu set data yang ingin kami gunakan jaringan Bayes untuk memprediksi atribut yang hilang. Mungkinkah ada hasil yang berbeda untuk kedua DAG? (Bonus jika Anda memberi contoh)G invGGinv
  3. Mirip dengan 2, tetapi lebih sederhana: Asumsikan DAG dan data diberikan. Anda dapat membuat grafik baru dengan membalik setiap kumpulan tepi, selama tetap asiklikal. Apakah jaringan Bayes setara dengan prediksi mereka?G G GGG
  4. Apakah kita mendapatkan sesuatu jika kita memiliki tepi yang mewakili kausalitas?

Jawaban:


6

TL; DR: terkadang Anda dapat membuat jaringan Bayesian yang setara dengan membalikkan panah, dan terkadang Anda tidak bisa.

Cukup membalik arah panah menghasilkan grafik terarah lain, tetapi grafik itu tidak selalu merupakan grafik dari jaringan Bayesian yang setara, karena hubungan ketergantungan yang diwakili oleh grafik panah terbalik dapat berbeda dari yang diwakili oleh grafik asli. Jika grafik panah terbalik menunjukkan hubungan ketergantungan yang berbeda dari aslinya, dalam beberapa kasus dimungkinkan untuk membuat jaringan Bayesian yang setara dengan menambahkan beberapa panah lagi untuk menangkap hubungan ketergantungan yang hilang dalam grafik panah terbalik. Tetapi dalam beberapa kasus tidak ada jaringan Bayesian yang persis sama. Jika Anda harus menambahkan beberapa panah untuk menangkap dependensi,

Misalnya, a -> b -> cmewakili dependensi dan independensi yang sama dengan a <- b <- c, dan sama dengan a <- b -> c, tetapi tidak sama dengan a -> b <- c. Grafik terakhir ini mengatakan bahwa adan cindependen jika btidak diamati, tetapi a <- b -> cmengatakan adan ctergantung dalam hal itu. Kita dapat menambahkan tepi langsung dari ake cuntuk menangkap itu, tetapi kemudian adan cmenjadi independen ketika bdiamati tidak terwakili. Itu berarti bahwa setidaknya ada satu faktorisasi yang tidak dapat kita manfaatkan ketika menghitung probabilitas posterior.

Semua hal ini tentang ketergantungan / kemandirian, panah dan pembalikannya, dll., Tercakup dalam teks standar pada jaringan Bayesian. Saya dapat menggali beberapa referensi jika Anda mau.

Jaringan Bayesian tidak mengekspresikan hubungan sebab akibat. Judea Pearl, yang melakukan banyak pekerjaan di jaringan Bayesian, juga bekerja pada apa yang ia sebut jaringan kausal (pada dasarnya jaringan Bayesian dijelaskan dengan hubungan sebab akibat).


Ini menjawab pertanyaan (2) dan (3). Apakah Anda punya ide tentang pertanyaan (1) dan (4) juga? (Ya, referensi akan lebih baik)
Martin Thoma

(1) Pertimbangkan kontrapositif: jika grafik panah terbalik memiliki siklus terarah, maka mengikuti panah di sekitar siklus mundur harus menjadi siklus terarah dalam grafik asli. (4) Jaringan Bayesian adalah model probabilistik dan karenanya tidak mewakili hubungan sebab akibat. Ada kemungkinan bahwa beberapa panah sebenarnya merujuk pada hubungan sebab akibat, tetapi ini hilang dalam model probabilistik. Mungkin amenyebabkan b, tetapi a -> bdan a <- bmodel probabilistik sama-sama valid.
Robert Dodier

Beberapa referensi pengantar. Koller & Friedman: "Model Grafis Probabilistik". Cowell, Dawid, Lauritzen, dan Spiegelhalter: "Jaringan Probabilistik dan Sistem Pakar". Castillo, Gutierrez, dan Hadi: "Sistem Pakar dan Model Jaringan Probabilistik".
Robert Dodier

Anda dapat membalikkan panah apa pun dan mendapatkan Bayesian Network yang setara selama Anda mempertahankan struktur-v (jangan membalikkan panah yang panah lainnya juga arahkan ke simpul yang ditunjuknya)
borgr

1

Ini mungkin agak tidak memuaskan, jadi jangan ragu untuk menerima jawaban ini, dan minta maaf sebelumnya.

Dalam jaring Bayes, node mewakili variabel acak, dan edge mewakili dependensi bersyarat. Ketika Anda menginterpretasikan node dengan cara tertentu, pengkondisian mengalir dengan cara tertentu secara alami. Membalikkannya secara sewenang-wenang tidak benar-benar masuk akal dalam konteks pemodelan data. Dan banyak waktu, panah memang mewakili kausalitas.


1
Ini cukup jauh dari sasaran. Interpretasi "alami" adalah sesuatu yang dikenakan pada model, itu bukan bagian dari model itu sendiri. Anda dapat membalikkan dependensi (menambahkan tepi tambahan jika diperlukan untuk mempertahankan set dependensi yang diwakili oleh jaringan) dan itu masih merupakan jaringan Bayesian. Masuk akal tidak dijawab dengan hanya memeriksa jaringan itu sendiri. Kebetulan Judea Pearl, salah satu penggerak besar di balik jaringan Bayesian di tahun 80-an dan 90-an, telah bekerja lebih baru-baru ini pada model formal untuk kausalitas, yang mengungkapkan hubungan sebab akibat dalam model.
Robert Dodier

Anda berkata, "Apakah masuk akal tidak dapat dijawab dengan memeriksa hanya jaringan itu sendiri." Saya tidak pernah mengatakan itu. Saya berkata "ketika Anda menafsirkan node dengan cara tertentu, pengkondisian mengalir dengan cara tertentu ..." Ini mungkin mencerminkan bias saya; Anda dapat menyebut hal-hal yang saya kerjakan di bayes net, tetapi pertanyaan ini tidak akan pernah muncul untuk saya. Sebagai contoh, jika dua node mewakili variabel yang sama pada waktu yang berbeda, tidak akan ada pertanyaan tentang arah mana pengkondisian mengalir. Namun, saya menerima kemungkinan bahwa ada situasi di mana orang mungkin menggunakan jaring Baye ini dengan cara yang tidak terlalu kaku.
Taylor

0

Pertanyaan 3

synergy.st-andrews.ac.uk/vannesmithlab mengklaim bahwa grafik

G1 = o->o->o and
G2 = o<-o->o

berada dalam satu kelas kesetaraan. Menurut sumber itu, model mewakili distribusi probabilitas gabungan yang persis sama.


Itu tidak benar. Untuk G1, yang pertama dan terakhir bergantung pada tidak adanya nilai yang diketahui. Untuk G2, yang pertama dan terakhir tidak tergantung pada tidak adanya nilai yang diketahui. Apakah Anda bermaksud menulis G2 = o <- o -> o? Lagi pula saya tidak melihat klaim tentang grafik tertentu pada halaman web yang telah Anda referensikan; mungkin Anda bisa lebih spesifik.
Robert Dodier
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.