Pertanyaan yang diberi tag «classification»

Klasifikasi statistik adalah masalah mengidentifikasi sub-populasi yang menjadi tempat pengamatan baru, di mana identitas sub-populasi tidak diketahui, berdasarkan pada serangkaian pelatihan data yang berisi pengamatan yang sub-populasi diketahui. Oleh karena itu klasifikasi ini akan menunjukkan perilaku variabel yang dapat dipelajari oleh statistik.


2
Menggabungkan classifier dengan membalik koin
Saya sedang mempelajari kursus pembelajaran mesin dan slide kuliah berisi informasi apa yang saya temukan bertentangan dengan buku yang direkomendasikan. Masalahnya adalah sebagai berikut: ada tiga pengklasifikasi: classifier A memberikan kinerja yang lebih baik di kisaran ambang yang lebih rendah, classifier B memberikan kinerja yang lebih baik dalam rentang ambang …

4
Klasifikasi dengan data tinggi lemak
Saya perlu melatih classifier linier pada laptop saya dengan ratusan ribu titik data dan sekitar sepuluh ribu fitur. Apa saja pilihan saya? Bagaimana keadaan seni untuk jenis masalah ini? Sepertinya penurunan gradien stokastik adalah arah yang menjanjikan, dan menurut saya ini adalah yang terbaik: "Pegasos: Perkiraan awal Sub-GrAdient SOlver untuk …

2
Meningkatnya jumlah fitur menghasilkan penurunan akurasi tetapi peningkatan sebelum / penarikan
Saya baru belajar Mesin. Saat ini saya menggunakan classifier Naive Bayes (NB) untuk mengklasifikasikan teks kecil dalam 3 kelas sebagai positif, negatif atau netral, menggunakan NLTK dan python. Setelah melakukan beberapa tes, dengan dataset yang terdiri dari 300.000 instance (16.924 positif, 7.477 negatif, dan 275.599 netral), saya menemukan bahwa ketika …

5
Apa sumber daya yang baik yang mencakup perbandingan pro dan kontra dari pengklasifikasi yang berbeda?
Apa classifier 2-kelas out-of-the-box terbaik? Ya, saya kira itu adalah pertanyaan jutaan dolar, dan ya, saya menyadari teorema makan siang gratis , dan saya juga membaca pertanyaan sebelumnya: Apa klasifikasi 2-out-of-the-box terbaik untuk aplikasi Anda? dan pengklasifikasi terburuk Tetap saja, saya tertarik membaca lebih banyak tentang masalah ini. Apa sumber …

4
Kesamaan statistik dari deret waktu
Seandainya seseorang memiliki deret waktu dari mana seseorang dapat mengambil berbagai pengukuran seperti periode, maksimum, minimum, rata-rata dll. Dan kemudian menggunakannya untuk membuat model gelombang sinus dengan atribut yang sama, adakah pendekatan statistik yang dapat digunakan untuk mengukur seberapa dekat data aktual sesuai dengan model yang diasumsikan? Jumlah titik data …



3
Untuk pengklasifikasi linier, apakah koefisien yang lebih besar menyiratkan fitur yang lebih penting?
Saya seorang insinyur perangkat lunak yang sedang mengerjakan pembelajaran mesin. Dari pemahaman saya, regresi linier (seperti OLS) dan klasifikasi linier (seperti regresi logistik dan SVM) membuat prediksi berdasarkan produk dalam antara koefisien terlatih dan variabel fitur → x :w⃗ w→\vec{w}x⃗ x→\vec{x} y^= f( b⃗ ⋅ x⃗ ) = f( ∑sayawsayaxsaya)y^=f(w→⋅x→)=f(∑sayawsayaxsaya) …

2
Apa ukuran kesalahan pelatihan untuk dilaporkan untuk Hutan Acak?
Saat ini saya memasang hutan acak untuk masalah klasifikasi menggunakan randomForestpaket dalam R, dan saya tidak yakin tentang cara melaporkan kesalahan pelatihan untuk model ini. Kesalahan pelatihan saya mendekati 0% ketika saya menghitungnya menggunakan prediksi yang saya dapatkan dengan perintah: predict(model, data=X_train) di mana X_traindata pelatihan. Dalam jawaban untuk pertanyaan …


2
Apa itu "baseline" dalam kurva recall presisi
Saya mencoba memahami kurva recall presisi, saya mengerti apa itu precision dan recall tapi yang saya tidak mengerti adalah nilai "baseline". Saya sedang membaca tautan ini https://classeval.wordpress.com/introduction/introduction-to-the-precision-recall-plot/ dan saya tidak mengerti bagian dasar seperti yang ditunjukkan dalam "Kurva Precision-Recall dari pengklasifikasi sempurna" apa fungsinya? dan bagaimana kita menghitungnya? Apakah ini …

1
Kedalaman pohon keputusan
Karena algoritma pohon keputusan terpecah pada suatu atribut pada setiap langkah, kedalaman maksimum pohon keputusan sama dengan jumlah atribut data. Apakah ini benar?


3
Bagaimana cara melakukan augmentasi data dan memvalidasi train?
Saya melakukan klasifikasi gambar menggunakan pembelajaran mesin. Misalkan saya memiliki beberapa data pelatihan (gambar) dan akan membagi data menjadi set pelatihan dan validasi. Dan saya juga ingin menambah data (menghasilkan gambar baru dari yang asli) dengan rotasi acak dan injeksi noise. Augmentaion dilakukan secara offline. Mana cara yang benar untuk …

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.