Pertanyaan yang diberi tag «classification»

Klasifikasi statistik adalah masalah mengidentifikasi sub-populasi yang menjadi tempat pengamatan baru, di mana identitas sub-populasi tidak diketahui, berdasarkan pada serangkaian pelatihan data yang berisi pengamatan yang sub-populasi diketahui. Oleh karena itu klasifikasi ini akan menunjukkan perilaku variabel yang dapat dipelajari oleh statistik.

1
Perbedaan antara regresi logistik dan mesin vektor dukungan?
Saya tahu bahwa regresi logistik menemukan hyperplane yang memisahkan sampel pelatihan. Saya juga tahu bahwa mesin Dukungan vektor menemukan hyperplane dengan margin maksimum. Pertanyaan saya: apakah perbedaan kemudian antara regresi logistik (LR) dan mesin vektor dukungan (SVM) adalah bahwa LR menemukan hyperplane yang memisahkan sampel pelatihan sementara SVM menemukan hyperplane …

1
Klasifikasi pembelajaran mesin big-O atau kompleksitas
Untuk mengevaluasi kinerja algoritma klasifikasi baru, saya mencoba untuk membandingkan akurasi dan kompleksitas (big-O dalam pelatihan dan klasifikasi). Dari Machine Learning: ulasan saya mendapatkan daftar pengklasifikasi lengkap yang diawasi, juga tabel akurasi antara algoritma, dan 44 masalah pengujian dari repositoy data UCI . Namun, saya tidak dapat menemukan ulasan, kertas, …

3
Bobot lebih banyak data terbaru dalam model Random Forest
Saya sedang melatih model klasifikasi dengan Random Forest untuk membedakan antara 6 kategori. Data transaksional saya memiliki sekitar 60k + pengamatan dan 35 variabel. Berikut adalah contoh bagaimana kira-kira terlihat. _________________________________________________ |user_id|acquisition_date|x_var_1|x_var_2| y_vay | |-------|----------------|-------|-------|--------| |111 | 2013-04-01 | 12 | US | group1 | |222 | 2013-04-12 | 6 …

1
Menggunakan LASSO di hutan acak
Saya ingin membuat hutan acak menggunakan proses berikut: Bangun pohon pada sampel data dan fitur acak menggunakan penguatan informasi untuk menentukan pemisahan Hentikan simpul daun jika melebihi kedalaman yang telah ditentukan ATAU perpecahan apa pun akan menghasilkan jumlah daun kurang dari minimum yang telah ditentukan Daripada menetapkan label kelas untuk …

1
RandomForest - interpretasi plot MDS
Saya menggunakan randomForest untuk mengklasifikasikan 6 perilaku hewan (mis. Berdiri, Berjalan, Berenang dll) berdasarkan 8 variabel (postur tubuh dan gerakan yang berbeda). MDSplot dalam paket randomForest memberi saya hasil ini dan saya memiliki masalah dalam menafsirkan hasilnya. Saya melakukan PCA pada data yang sama dan mendapat pemisahan yang bagus antara …



5
Algoritme klasifikasi statistik manakah yang dapat memprediksi benar / salah untuk urutan input?
Diberikan urutan input, saya perlu menentukan apakah urutan ini memiliki properti yang diinginkan. Properti hanya bisa benar atau salah, yaitu, hanya ada dua kelas yang mungkin dimiliki urutan. Hubungan yang tepat antara urutan dan properti tidak jelas, tetapi saya percaya itu sangat konsisten dan harus memberikan klasifikasi statistik. Saya memiliki …

1
Ketika over / under-sampling kelas tidak seimbang, apakah memaksimalkan akurasi berbeda dari meminimalkan biaya kesalahan klasifikasi?
Pertama-tama, saya ingin menjelaskan beberapa tata letak umum yang digunakan buku Penambangan Data yang menjelaskan cara menangani Kumpulan Data Tidak Seimbang . Biasanya bagian utama dinamai Dataset Tidak Seimbang dan mencakup dua subbagian ini: Klasifikasi Sensitif Biaya dan Teknik Pengambilan Sampel. Tampaknya menghadapi masalah dengan kelas langka, Anda dapat melakukan …


3
Bisakah model CART dibuat kuat?
Seorang kolega di kantor saya berkata kepada saya hari ini, "Model pohon tidak bagus karena tertangkap oleh pengamatan ekstrim". Pencarian di sini menghasilkan utas ini yang pada dasarnya mendukung klaim. Yang mengarahkan saya ke pertanyaan - dalam situasi apa model CART dapat menjadi kuat, dan bagaimana hal itu ditunjukkan?


1
Caret glmnet vs cv.glmnet
Tampaknya ada banyak kebingungan dalam perbandingan menggunakan di glmnetdalam caretuntuk mencari lambda yang optimal dan menggunakan cv.glmnetuntuk melakukan tugas yang sama. Banyak pertanyaan diajukan, misalnya: Klasifikasi model train.glmnet vs. cv.glmnet? Apa cara yang tepat untuk menggunakan glmnet dengan caret? Validasi silang `glmnet` menggunakan` caret` tetapi tidak ada jawaban yang diberikan, …

1
GAM vs LOESS vs splines
Konteks : Saya ingin menggambar garis di sebar yang tidak tampak parametrik, oleh karena itu saya gunakan geom_smooth()di ggplotdalam R. Secara otomatis mengembalikan geom_smooth: method="auto" and size of largest group is >=1000, so using gam with formula: y ~ s(x, bs = "cs"). Use 'method = x' to change the …


Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.