Saya mencoba membuat pendekatan untuk mendeteksi iklan penipuan di situs web saya. Saya pikir masalahnya ada banyak kesamaan dengan mendeteksi email spam (yang mana Bayesian classifier adalah solusi umum) karena banyak sinyal yang mengindikasikan penipuan akan ditemukan dalam teks iklan.
Namun, ada beberapa informasi lain yang bisa menjadi indikator scam yang baik, tapi saya tidak yakin apakah / bagaimana classifier Bayes dapat menggunakannya, karena mereka melibatkan nilai numerik (dengan nilai pada ekstrem rentang yang mencurigakan) daripada dari nilai-nilai biner sederhana yang sesuai dengan ada atau tidak adanya kata dalam teks.
Misalnya, banyak iklan penipuan memiliki harga item yang ditetapkan sangat rendah (untuk menarik banyak tampilan), jadi saya ingin harga yang lebih rendah dari harga normal menjadi indikator kuat bahwa iklan tersebut mungkin merupakan penipuan.
Apakah Bayes masih cocok untuk kebutuhan saya, jika tidak, bisakah Anda merekomendasikan pendekatan yang berbeda?