Saya kagum bahwa saya tidak dapat menemukan artikel / kuliah tentang bagaimana seseorang dapat memasukkan Distribusi Probabilitas Kelas Sebelumnya dalam pengklasifikasi seperti Regresi Logistik atau Hutan Acak.
Jadi pertanyaan saya adalah:
Bagaimana menggabungkan Distribusi Probabilitas Kelas Sebelumnya dalam Regresi Logistik atau Hutan Acak?
Apakah memasukkan Distribusi Probabilitas Kelas Sebelumnya menyiratkan bahwa saya harus menggunakan mesin Bayesian?
Saya menghadapi tugas klasifikasi di mana saya tahu bahwa kelas a jauh lebih mungkin daripada kelas b.
Solusi adhoc adalah dengan hanya memasukkan lebih banyak sampel untuk kelas a dalam set pelatihan, tetapi apakah ada hasil teoritis tentang ini?
Satu hal yang saya pikirkan adalah mengubah ambang keputusan dari 0,5 menjadi nilai dengan mempertimbangkan ketidakseimbangan sebelumnya. Tetapi saya bahkan tidak yakin apakah itu masuk akal secara teori, karena pada titik di mana saya siap untuk mengambil keputusan, saya sudah melihat semua nilai fitur jadi saya tidak perlu peduli tentang probabilitas sebelumnya tetapi probabilitas bersyarat kelas.