Pertanyaan yang diberi tag «classification»

Klasifikasi statistik adalah masalah mengidentifikasi sub-populasi yang menjadi tempat pengamatan baru, di mana identitas sub-populasi tidak diketahui, berdasarkan pada serangkaian pelatihan data yang berisi pengamatan yang sub-populasi diketahui. Oleh karena itu klasifikasi ini akan menunjukkan perilaku variabel yang dapat dipelajari oleh statistik.


8
Bagaimana saya bisa membantu memastikan data pengujian tidak bocor ke dalam data pelatihan?
Misalkan kita memiliki seseorang yang membangun model prediktif, tetapi seseorang belum tentu berpengalaman dalam prinsip-prinsip statistik atau pembelajaran mesin yang tepat. Mungkin kita membantu orang itu saat mereka sedang belajar, atau mungkin orang itu menggunakan semacam paket perangkat lunak yang membutuhkan pengetahuan minimal untuk digunakan. Sekarang orang ini mungkin sangat …

6
Alternatif untuk regresi logistik di R
Saya ingin banyak algoritma yang melakukan tugas yang sama dengan regresi logistik. Itu adalah algoritma / model yang dapat memberikan prediksi untuk respon biner (Y) dengan beberapa variabel penjelas (X). Saya akan senang jika setelah Anda menyebutkan algoritma, jika Anda juga akan menunjukkan cara mengimplementasikannya dalam R. Berikut adalah kode …

5
Kapan data tidak seimbang benar-benar masalah dalam Pembelajaran Mesin?
Kami sudah memiliki beberapa pertanyaan tentang data yang tidak seimbang ketika menggunakan regresi logistik , SVM , pohon keputusan , mengantongi dan sejumlah pertanyaan serupa lainnya, yang menjadikannya topik yang sangat populer! Sayangnya, masing-masing pertanyaan tampaknya khusus untuk algoritma dan saya tidak menemukan pedoman umum untuk menangani data yang tidak …



4
Mengapa tidak mendekati klasifikasi melalui regresi?
Beberapa bahan yang saya lihat pada pembelajaran mesin mengatakan bahwa itu adalah ide yang buruk untuk mendekati masalah klasifikasi melalui regresi. Tapi saya pikir itu selalu mungkin untuk melakukan regresi terus menerus agar sesuai dengan data dan memotong prediksi terus menerus untuk menghasilkan klasifikasi diskrit. Jadi mengapa itu ide yang …

4
Ambang peluang klasifikasi
Saya punya pertanyaan tentang klasifikasi secara umum. Misalkan f adalah classifier, yang menampilkan sekumpulan probabilitas yang diberikan beberapa data D. Biasanya, orang akan mengatakan: well, jika P (c | D)> 0,5, kami akan menetapkan kelas 1, jika tidak 0 (biarkan ini menjadi biner klasifikasi). Pertanyaan saya adalah, bagaimana jika saya …

3
Mengapa regresi logistik adalah classifier linier?
Karena kita menggunakan fungsi logistik untuk mengubah kombinasi linear dari input menjadi output non-linear, bagaimana regresi logistik dapat dianggap sebagai classifier linier? Regresi linier sama seperti jaringan saraf tanpa lapisan tersembunyi, jadi mengapa jaringan saraf dianggap sebagai pengklasifikasi non-linear dan regresi logistik linear?


2
Asumsi hutan acak
Saya agak baru ke hutan acak jadi saya masih berjuang dengan beberapa konsep dasar. Dalam regresi linier, kami mengasumsikan pengamatan independen, varians konstan ... Apa asumsi / hipotesis dasar yang kita buat, ketika kita menggunakan hutan acak? Apa perbedaan utama antara hutan acak dan bayaran naif dalam hal asumsi model?

6
Fitur untuk klasifikasi deret waktu
Saya mempertimbangkan masalah klasifikasi (multi-kelas) berdasarkan seri waktu dari panjang variabel , yaitu, untuk menemukan fungsi melalui representasi global dari seri waktu oleh serangkaian fitur yang dipilih dari ukuran tetap independen dari , dan kemudian gunakan metode klasifikasi standar pada set fitur ini. Saya tidak tertarik dengan perkiraan, yaitu memprediksif …


6
Mengapa downsample?
Misalkan saya ingin mempelajari classifier yang memprediksi jika email adalah spam. Dan anggaplah hanya 1% dari email adalah spam. Hal termudah untuk dilakukan adalah mempelajari pengklasifikasi sepele yang mengatakan tidak ada email yang merupakan spam. Penggolong ini akan memberi kita akurasi 99%, tetapi tidak akan mempelajari sesuatu yang menarik, dan …

9
Bagaimana cara menginterpretasikan nilai ukuran-F?
Saya ingin tahu bagaimana menafsirkan perbedaan nilai-nilai f-ukur. Saya tahu bahwa ukuran-f adalah rata-rata yang seimbang antara presisi dan daya ingat, tetapi saya bertanya tentang arti praktis dari perbedaan dalam ukuran-F. Sebagai contoh, jika classifier C1 memiliki akurasi 0,4 dan classifier C2 lainnya akurasi 0,8, maka kita dapat mengatakan bahwa …

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.