Banyak spam masuk melalui filter pada server mail yang saya jalankan dengan trik yang relatif sederhana untuk memulai dengan beberapa baris penurunan berat badan (sangat jelas) atau teks penipuan lainnya di bagian atas, diikuti oleh badan teks yang lebih besar dari dokumentasi pemrograman - atau, yang paling jahat dari semuanya, teks yang diambil dari Stack Exchange . Paling-paling, Spamassassin menganggap ini sebagai BAYES_50, dan kebetulan pesan lainnya dibuat dengan cukup hati-hati sehingga tidak mencapai pemicu lain. (Misalnya, tajuknya minimal dan benar.) Seringkali, kutipan yang disertakan cukup selaras dengan minat sah saya sehingga pesan secara keseluruhan dinilai sebagai BAYES_00, karena token yang sangat spam hanya dibanjiri oleh nugget juicy dari pemecahan masalah sysadmin.
Bagian atas jelas-jelas spam (dan sebenarnya cenderung sangat mirip dengan yang sebelumnya diterima dan dilatih sebagai pesan spam) sehingga saya agak kagum karena bisa melewatinya - tetapi jelas itu. Sepertinya sebuah pas terpisah yang mencetak 25 (atau lebih) baris pesan dan menimbang bahwa banyak akan menyelesaikan masalah. Apakah ada cara untuk melakukan ini?
Beberapa orang menyarankan untuk menulis ekspresi reguler khusus. Saya tidak ingin membahas hal ini, karena ini adalah pertempuran yang terus-menerus hilang. Itulah yang dilakukan orang sebelum penyortiran spam Bayesian mulai digunakan secara luas, dan itu pada umumnya mengerikan. Tidak ada manusia yang bisa mengikuti . Ini tidak jauh lebih efektif daripada hanya menekan tombol hapus untuk setiap pesan spam, dan lebih banyak pekerjaan pada bagian saya.
Penyaringan spam Bayesian berfungsi. Ia bahkan berfungsi pada spam ini , jika saya membagi bagian "di atas flip " dan hanya menganalisis bagian itu, dengan umpan / sekam dihapus. Pertanyaannya adalah: bagaimana saya bisa membuat Spamassassin melakukan itu?