Saya punya pertanyaan tentang klasifikasi secara umum. Misalkan f adalah classifier, yang menampilkan sekumpulan probabilitas yang diberikan beberapa data D. Biasanya, orang akan mengatakan: well, jika P (c | D)> 0,5, kami akan menetapkan kelas 1, jika tidak 0 (biarkan ini menjadi biner klasifikasi).
Pertanyaan saya adalah, bagaimana jika saya mengetahuinya, bahwa jika saya mengklasifikasikan sebagai 1 juga probabilitas, lebih besar dari: yaitu 0,2, pengklasifikasi bekerja lebih baik. Apakah sah untuk menggunakan ambang baru ini saat melakukan klasifikasi?
Saya akan menginterpretasikan perlunya batas klasifikasi yang lebih rendah dalam konteks data yang memancarkan sinyal yang lebih kecil; namun masih signifikan untuk masalah klasifikasi.
Saya menyadari ini adalah salah satu cara untuk melakukannya, namun jika ini bukan pemikiran yang benar, apa yang akan menjadi beberapa transformasi data, yang menekankan fitur individu dengan cara yang sama, sehingga ambang batas dapat tetap di 0,5?