(Jawaban hamner sangat bagus, jadi cukup posting silang jawaban saya dari MetaOptimize untuk kelengkapan.)
Saya pikir algoritma generatif sebagai menyediakan model bagaimana data sebenarnya dihasilkan (saya pikir mereka memberikan Anda model dan , daripada , meskipun saya kira itu setara), dan algoritma diskriminatif hanya menyediakan pemisahan klasifikasi (dan belum tentu secara probabilistik).P(X|Y)P(Y)P(X,Y)
Bandingkan, misalnya, model campuran Gaussian dan pengelompokan k-mean. Dalam yang pertama, kami memiliki model probabilistik yang bagus untuk bagaimana poin dihasilkan (pilih komponen dengan beberapa probabilitas, dan kemudian memancarkan titik dengan pengambilan sampel dari distribusi Gaussian komponen), tetapi tidak ada yang dapat kami katakan tentang yang terakhir.
Perhatikan bahwa algoritma generatif memiliki sifat diskriminatif, karena Anda bisa mendapatkan setelah Anda memiliki dan (oleh Bayes 'Theorem), meskipun algoritma diskriminatif tidak benar-benar memiliki sifat generatif.P(Y|X)P(X|Y)P(Y)
1: Algoritma diskriminatif memungkinkan Anda untuk mengklasifikasikan poin, tanpa memberikan model bagaimana poin sebenarnya dihasilkan. Jadi ini bisa berupa:
- algoritma probabilistik mencoba mempelajari (mis., regresi logistik);P(Y|X)
- atau algoritma non-probabilistik yang mencoba mempelajari pemetaan langsung dari titik ke kelas (misalnya, perceptron dan SVM hanya memberi Anda hyperplane pemisah, tetapi tidak ada model untuk menghasilkan poin baru).
Jadi ya, pengklasifikasi diskriminatif adalah pengklasifikasi yang tidak generatif.
Cara lain untuk berpikir tentang ini adalah bahwa algoritma generatif membuat semacam asumsi struktur pada model Anda , tetapi algoritma diskriminatif membuat lebih sedikit asumsi. Misalnya, Naive Bayes mengasumsikan independensi bersyarat dari fitur Anda, sedangkan regresi logistik ("mitra" diskriminatif dari Naive Bayes) tidak.
2: Ya, Naif Bayes adalah generatif karena menangkap dan . Misalnya, jika kita tahu bahwa dan , bersama dengan probabilitas kata Inggris dan Perancis, maka kita sekarang dapat menghasilkan dokumen baru dengan terlebih dahulu memilih bahasa dokumen ( Bahasa Inggris dengan probabilitas 0,7, Prancis dengan probabilitas 0,3), dan kemudian menghasilkan kata-kata sesuai dengan probabilitas kata bahasa yang dipilih.P(X|Y)P(Y)P(Y=English)=0.7P(Y=French)=0.3
Ya, saya kira Anda bisa membuat regresi logistik generatif dengan cara itu, tetapi itu hanya karena Anda menambahkan sesuatu ke regresi logistik yang belum ada di sana. Yaitu, ketika Anda melakukan klasifikasi Naive Bayes, Anda secara langsung menghitung (ketentuan di sebelah kanan, dan , adalah apa yang memungkinkan Anda untuk menghasilkan dokumen baru); tetapi ketika Anda menghitung dalam regresi logistik, Anda tidak menghitung kedua hal ini, Anda hanya menerapkan fungsi logistik ke produk titik.P(Y|X)∝P(X|Y)P(Y)P(X|Y)P(Y)P(Y|X)
3: Model generatif sering kali mengungguli model diskriminatif pada set data yang lebih kecil karena asumsi generatifnya menempatkan beberapa struktur pada model Anda yang mencegah overfitting . Sebagai contoh, mari kita pertimbangkan Naif Bayes vs Regresi Logistik. Asumsi Naive Bayes tentu saja jarang dipenuhi, jadi regresi logistik akan cenderung mengungguli Naive Bayes ketika dataset Anda tumbuh (karena ia dapat menangkap dependensi yang tidak bisa dilakukan oleh Naive Bayes). Tetapi ketika Anda hanya memiliki satu set data kecil, regresi logistik mungkin mengambil pola palsu yang tidak benar-benar ada, sehingga Naive Bayes bertindak sebagai semacam pengatur pada model Anda yang mencegah overfitting. Ada sebuah makalah oleh Andrew Ng dan Michael Jordan tentang pengklasifikasi diskriminatif vs generatif yang membicarakan hal ini lebih lanjut.
4: Saya pikir maksudnya adalah bahwa model generatif dapat benar-benar mempelajari struktur data yang mendasarinya jika Anda menentukan model Anda dengan benar dan model tersebut benar-benar berlaku, tetapi model diskriminatif dapat mengungguli jika asumsi generatif Anda tidak dipenuhi (karena algoritma diskriminatif adalah kurang terikat pada struktur tertentu, dan dunia nyata berantakan dan asumsi jarang terpuaskan dengan sempurna). (Saya mungkin akan mengabaikan kutipan ini jika mereka membingungkan.)