Perbedaan antara Bayes naif & Bayes naif multinomial


29

Saya pernah berurusan dengan classifier Naif Bayes sebelumnya. Saya telah membaca tentang Multinomial Naif Bayes belakangan ini.

Juga Probabilitas Posterior = (Sebelum * Kemungkinan) / (Bukti) .

Satu-satunya perbedaan utama (saat memprogram pengklasifikasi ini) yang saya temukan antara Naive Bayes & Multinomial Naive Bayes adalah bahwa

Multinomial Naive Bayes menghitung kemungkinan untuk dihitung dari suatu kata / token (variabel acak) dan Naive Bayes menghitung kemungkinan sebagai berikut:

masukkan deskripsi gambar di sini

Koreksi saya jika saya salah!


1
Anda akan menemukan banyak informasi dalam pdf berikut: cs229.stanford.edu/notes/cs229-notes2.pdf
B_Miner

Christopher D. Manning, Prabhakar Raghavan dan Hinrich Schütze. " Pengantar Pengambilan Informasi. " 2009, bab 13 tentang klasifikasi teks dan Naif Bayes juga bagus.
Franck Dernoncourt

Jawaban:


43

f1fn

hal(f1,...,fn|c)=saya=1nhal(fsaya|c)

Ini berarti bahwa ketika saya ingin menggunakan model Naive Bayes untuk mengklasifikasikan contoh baru, probabilitas posterior jauh lebih mudah untuk dikerjakan:

hal(c|f1,...,fn)hal(c)hal(f1|c)...hal(fn|c)

Tentu saja asumsi independensi ini jarang benar, yang dapat menjelaskan mengapa beberapa orang menyebut model itu sebagai model "Idiot Bayes", tetapi dalam praktiknya model Naif Bayes telah menunjukkan kinerja yang sangat baik, bahkan pada tugas-tugas rumit di mana jelas bahwa yang kuat asumsi independensi salah.

Hingga saat ini kami tidak mengatakan apa-apa tentang distribusi setiap fitur. Dengan kata lain, kita membiarkan tidak terdefinisi. Istilah Multinomial Naive Bayes secara sederhana memberi tahu kita bahwa masing-masing adalah distribusi multinomial, daripada beberapa distribusi lainnya. Ini berfungsi baik untuk data yang dapat dengan mudah diubah menjadi jumlah, seperti jumlah kata dalam teks.hal(fsaya|c)hal(fsaya|c)

Distribusi yang telah Anda gunakan dengan classifier Naive Bayes Anda adalah pdf Guassian, jadi saya kira Anda bisa menyebutnya sebagai classifier Guassian Naive Bayes.

Singkatnya, pengklasifikasi Naive Bayes adalah istilah umum yang merujuk pada independensi bersyarat dari masing-masing fitur dalam model, sedangkan pengelompokan Multinomial Naive Bayes adalah contoh spesifik dari pengklasifikasi Naive Bayes yang menggunakan distribusi multinomial untuk masing-masing fitur.

Referensi:

Stuart J. Russell dan Peter Norvig. 2003. Kecerdasan Buatan: Pendekatan Modern (2 ed.). Pendidikan Pearson. Lihat hal. 499 untuk referensi "idiot Bayes" serta definisi umum model Naif Bayes dan asumsi independensinya


Tautan terputus
ssoler

@ jlund3, Terima kasih atas penjelasannya. Bagaimana kita memasukkan informasi distribusi ke dalam classifier kita? Maksud saya, bagaimana fomula p (c | f1, ..., fn) ∝p (c) p (f1 | c) ... p (fn | c) berubah berdasarkan apakah distribusi Guassian vs multimodal
David

Terima kasih atas penjelasan singkatnya tetapi saya merekomendasikan buku ini (Stuart J. Russell dan Peter Norvig. 2003. Inteligensi Buatan: Pendekatan Modern (2 ed.)) Dirujuk di atas untuk pengetahuan lebih lanjut tentang NB dan Teknik Kecerdasan Buatan juga ..
Mirani

jumlah distribusi multinomial tidak independen. lihat pertanyaan saya di sini: datacience.stackexchange.com/questions/32016/...
Hanan Shteingart

10

P(xsaya|cj)1sayan1jk(saya,j)P(xsaya|cj1)P(xsaya|cj2)

Multinomial Naif Bayes hanya mengasumsikan distribusi multinomial untuk semua pasangan, yang tampaknya menjadi asumsi yang masuk akal dalam beberapa kasus, yaitu untuk jumlah kata dalam dokumen.

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.