Apa cara terbaik untuk mengkategorikan pendekatan yang telah dikembangkan untuk mengatasi masalah kelas ketidakseimbangan?
Artikel ini mengelompokkannya menjadi:
- Preprocessing: termasuk metode oversampling, undersampling dan hybrid,
- Pembelajaran sensitif biaya: termasuk metode langsung dan meta-learning yang selanjutnya dibagi menjadi thresholding dan sampling,
- Teknik ensemble: mencakup ansambel yang sensitif terhadap biaya dan pemrosesan data bersama dengan pembelajaran ansambel.
The kedua klasifikasi:
- Pra-pemrosesan data: termasuk perubahan distribusi dan pembobotan ruang data. Pembelajaran satu kelas dianggap sebagai perubahan distribusi.
- Metode Pembelajaran Tujuan Khusus
- Prediksi Post-processing: termasuk metode threshold dan post-processing yang sensitif biaya
- Metode Hibrida:
Artikel ketiga :
- Metode tingkat data
- Metode tingkat algoritma
- Metode hibrid
Klasifikasi terakhir juga menganggap penyesuaian output sebagai pendekatan independen.
Terima kasih sebelumnya.
4
Jawaban yang sangat singkat: semuanya adalah yang terbaik dan semuanya adalah yang terburuk! Klasifikasi dan penambangan data pada umumnya sangat peka konteks. Tidak ada satu ukuran cocok untuk semua solusi di domain ini. Omong-omong, pendekatan terbaik, dalam istilah yang sangat umum, biasanya merupakan kombinasi dari keputusan terbaik di tingkat yang berbeda dari ekstraksi fitur, ke skema evaluasi.
—
mok
@ mas, terima kasih. Bisakah Anda memberi tahu saya bobot kelas dalam pengklasifikasi sklearn misalnya, regresi logistik diklasifikasikan ke dalam kategori mana?
—
ebrahimi
@ebrahimi, harus jatuh ke level algoritma karena hanya bobot yang disesuaikan menurut kamus yang diberikan atau dihitung (disimpulkan) sesuai dengan nilai y (kelas) dan data tetap tidak tersentuh.
—
Sanjay Krishna
@SanjayKrishna Terima kasih banyak. Dalam kasus kategorisasi pertama, itu jatuh ke dalam pembelajaran yang sensitif biaya, bukan? Juga, dalam kasus taksonomi kedua, itu akan diklasifikasikan ke dalam kategori ketiga yaitu, pasca-pemrosesan sensitif biaya. apakah itu benar Jawaban kedua untuk ini: stackoverflow.com/questions/32492550/… juga berguna.
—
ebrahimi