Pertanyaan yang diberi tag «unbalanced-classes»

Data yang diorganisasikan ke dalam kategori diskrit atau * kelas * dapat menimbulkan masalah untuk analisis tertentu jika jumlah pengamatan ( ) yang dimiliki masing-masing kelas tidak konstan di seluruh kelas. Kelas dengan tidak sama * tidak seimbang *. nn

2
Menambahkan bobot pada regresi logistik untuk data yang tidak seimbang
Saya ingin memodelkan regresi logistik dengan data yang tidak seimbang (9: 1). Saya ingin mencoba opsi bobot dalam glmfungsi di R, tapi saya tidak 100% yakin apa fungsinya. Katakanlah variabel output saya c(0,0,0,0,0,0,0,0,0,1). sekarang saya ingin memberi "1" 10 kali lebih berat. jadi saya memberikan argumen bobot weights=c(1,1,1,1,1,1,1,1,1,1,1,10). Ketika saya …


2
Menguji Klasifikasi pada Data Ketidakseimbangan yang Berlebihan
Saya sedang mengerjakan data yang sangat tidak seimbang. Dalam literatur, beberapa metode digunakan untuk menyeimbangkan kembali data menggunakan re-sampling (over-atau under-sampling). Dua pendekatan yang baik adalah: SMOTE: Tehnik Sintetis Minoritas Berlebih ( SMOTE ) ADASYN: Pendekatan Sampling Sintetis Adaptif untuk Pembelajaran Ketidakseimbangan ( ADASYN ) Saya telah menerapkan ADASYN karena …


2
Apakah klasifikasi GBM menderita ukuran kelas yang tidak seimbang?
Saya sedang berurusan dengan masalah klasifikasi biner yang diawasi. Saya ingin menggunakan paket GBM untuk mengklasifikasikan individu sebagai tidak terinfeksi / terinfeksi. Saya memiliki 15 kali lebih tidak terinfeksi daripada orang yang terinfeksi. Saya bertanya-tanya apakah model GBM menderita jika ukuran kelas tidak seimbang? Saya tidak menemukan referensi yang menjawab …

3
Saran untuk pembelajaran yang sensitif biaya dalam lingkungan yang sangat tidak seimbang
Saya memiliki dataset dengan beberapa juta baris dan ~ 100 kolom. Saya ingin mendeteksi sekitar 1% dari contoh dalam dataset, yang termasuk kelas umum. Saya memiliki batasan presisi minimum, tetapi karena biaya yang sangat asimetris, saya tidak terlalu tertarik pada penarikan tertentu (selama saya tidak dibiarkan dengan 10 pertandingan positif!) …

3
SVM untuk data yang tidak seimbang
Saya ingin mencoba menggunakan Support Vector Machines (SVMs) pada dataset saya. Sebelum saya mencoba masalah, saya diperingatkan bahwa SVM tidak bekerja dengan baik pada data yang sangat tidak seimbang. Dalam kasus saya, saya dapat memiliki sebanyak 95-98% 0 dan 2-5% 1. Saya mencoba untuk menemukan sumber daya yang berbicara tentang …


1
Akurasi seimbang vs skor F-1
Saya bertanya-tanya apakah ada yang bisa menjelaskan perbedaan antara akurasi yang seimbang b_acc = (sensitivity + specificity)/2 dan skor f1 yaitu: f1 = 2*precision*recall/(precision + recall)

1
Ketika over / under-sampling kelas tidak seimbang, apakah memaksimalkan akurasi berbeda dari meminimalkan biaya kesalahan klasifikasi?
Pertama-tama, saya ingin menjelaskan beberapa tata letak umum yang digunakan buku Penambangan Data yang menjelaskan cara menangani Kumpulan Data Tidak Seimbang . Biasanya bagian utama dinamai Dataset Tidak Seimbang dan mencakup dua subbagian ini: Klasifikasi Sensitif Biaya dan Teknik Pengambilan Sampel. Tampaknya menghadapi masalah dengan kelas langka, Anda dapat melakukan …





3
Apa fungsi kerugian yang harus digunakan untuk mendapatkan classifier biner yang presisi atau tinggi?
Saya mencoba membuat detektor objek yang sangat jarang terjadi (dalam gambar), berencana untuk menggunakan classifier biner CNN yang diterapkan pada jendela geser / ukuran. Saya telah membangun pelatihan 1: 1 positif-negatif yang seimbang dan set tes (apakah itu hal yang benar untuk dilakukan dalam kasus seperti itu?), Dan classifier baik-baik …

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.