Pertanyaan yang diberi tag «classification»

Sebuah instance dari pembelajaran yang diawasi yang mengidentifikasi kategori atau kategori yang dimiliki oleh instance dataset baru.

4
Data multi-kelas miring
Saya memiliki dataset yang berisi ~ 100.000 sampel dari 50 kelas. Saya telah menggunakan SVM dengan kernel RBF untuk melatih dan memprediksi data baru. Masalahnya adalah dataset cenderung condong ke kelas yang berbeda. Misalnya, Kelas 1 - 30 (masing-masing 3%), Kelas 31 - 45 (~ masing-masing 0,6%), Kelas 46 - …

1
Data yang tidak seimbang menyebabkan kesalahan klasifikasi pada dataset multiclass
Saya sedang mengerjakan klasifikasi teks di mana saya memiliki 39 kategori / kelas dan 8,5 juta catatan. (Dalam data dan kategori masa depan akan meningkat). Struktur atau format data saya adalah sebagai berikut. ---------------------------------------------------------------------------------------- | product_title | Key_value_pairs | taxonomy_id | ---------------------------------------------------------------------------------------- Samsung S7 Edge | Color:black,Display Size:5.5 inch,Internal | …


4
Klasifikasi deret waktu multivarian
Saya memiliki satu set data yang terdiri dari deret waktu (8 poin) dengan sekitar 40 dimensi (jadi setiap deret waktu 8 per 40). Ouput yang sesuai (hasil yang mungkin untuk kategori) adalah eitheir 0 atau 1. Apa yang akan menjadi pendekatan terbaik untuk merancang classifier untuk deret waktu dengan berbagai …

2
Klasifikasi urutan vektor
Dataset saya terdiri dari sekuens vektor. Setiap vektor memiliki 50 dimensi bernilai nyata. Jumlah vektor dalam rentang urutan 3-5 hingga 10-15. Dengan kata lain, panjang urutan tidak tetap. Sejumlah urutan yang adil (bukan vektor!) Dijelaskan dengan label kelas. Tugas saya adalah mempelajari classifier yang diberi urutan vektor, label kelas untuk …


4
Sarankan set data pelatihan penggolong teks
Kumpulan data mana yang tersedia secara bebas yang dapat saya gunakan untuk melatih classifier teks? Kami mencoba untuk meningkatkan keterlibatan pengguna kami dengan merekomendasikan konten yang paling terkait untuknya, jadi kami pikir. Jika kami mengklasifikasikan konten kami berdasarkan kantong kata yang telah ditentukan, kami dapat merekomendasikan kepadanya untuk melibatkan konten …

1
Penambangan Data Relasional tanpa ILP
Saya memiliki dataset besar dari database relasional yang saya perlukan untuk membuat model klasifikasi. Biasanya untuk situasi ini saya akan menggunakan Pemrograman Logika Induktif (ILP), tetapi karena keadaan khusus saya tidak bisa melakukan itu. Cara lain untuk mengatasi hal ini adalah dengan mencoba menggabungkan nilai ketika saya memiliki hubungan asing. …


1
Bisakah pelatihan label kepercayaan diri digunakan untuk meningkatkan akurasi prediksi?
Saya memiliki data pelatihan yang diberi label dengan nilai biner. Saya juga telah mengumpulkan kepercayaan dari masing-masing label ini yaitu 0,8 keyakinan akan berarti bahwa 80% dari pekerja manusia setuju pada label itu. Apakah mungkin untuk menggunakan data kepercayaan ini untuk meningkatkan akurasi classifier saya? Akankah cara berikut ini berhasil? …


1
Kategorisasi pendekatan untuk menangani kelas yang tidak seimbang
Apa cara terbaik untuk mengkategorikan pendekatan yang telah dikembangkan untuk mengatasi masalah kelas ketidakseimbangan? Artikel ini mengelompokkannya menjadi: Preprocessing: termasuk metode oversampling, undersampling dan hybrid, Pembelajaran sensitif biaya: termasuk metode langsung dan meta-learning yang selanjutnya dibagi menjadi thresholding dan sampling, Teknik ensemble: mencakup ansambel yang sensitif terhadap biaya dan pemrosesan …

2
Hasil LightGBM berbeda tergantung pada urutan data
Saya memiliki dua dataset A dan B yang persis sama dalam hal jumlah kolom, nama kolom, dan nilai-nilai. Satu-satunya perbedaan adalah urutan kolom-kolom itu. Saya kemudian melatih model LightGBM pada masing-masing dua set data dengan langkah-langkah berikut Bagilah setiap dataset ke dalam pelatihan dan pengujian (gunakan seed dan rasio acak …



Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.