Pertanyaan yang diberi tag «classification»

Klasifikasi statistik adalah masalah mengidentifikasi sub-populasi yang menjadi tempat pengamatan baru, di mana identitas sub-populasi tidak diketahui, berdasarkan pada serangkaian pelatihan data yang berisi pengamatan yang sub-populasi diketahui. Oleh karena itu klasifikasi ini akan menunjukkan perilaku variabel yang dapat dipelajari oleh statistik.

1
Nama analog kesalahan absolut rata-rata dengan skor Brier?
Pertanyaan kemarin Menentukan akurasi model yang memperkirakan probabilitas acara membuat saya ingin tahu tentang penilaian probabilitas. The Brier skor adalah rata-rata kuadrat error ukuran. Apakah pengukuran kinerja kesalahan absolut rata-rata analog punya nama juga?1N∑i=1N(predictioni−referencei)21N∑i=1N(predictioni−referencei)2\frac{1}{N}\sum\limits _{i=1}^{N}(prediction_i - reference_i)^2 1N∑i=1N|predictioni−referencei|1N∑i=1N|predictioni−referencei|\frac{1}{N}\sum\limits _{i=1}^{N}|prediction_i - reference_i|



2
mengoptimalkan auc vs logloss dalam masalah klasifikasi biner
Saya melakukan tugas klasifikasi biner di mana probabilitas hasil cukup rendah (sekitar 3%). Saya mencoba memutuskan apakah akan mengoptimalkan dengan AUC atau log-loss. Seperti yang saya mengerti, AUC memaksimalkan kemampuan model untuk membedakan antara kelas-kelas sementara logloss menghukum perbedaan antara probabilitas aktual dan estimasi. Dalam tugas saya sangat penting untuk …



3
Deteksi outlier dalam set yang sangat kecil
Saya perlu mendapatkan seakurat mungkin nilai untuk kecerahan sumber cahaya yang stabil terutama yang diberikan dua belas nilai luminositas sampel. Sensornya tidak sempurna, dan cahayanya kadang-kadang bisa "berkedip" lebih terang atau lebih gelap, yang bisa diabaikan, karenanya saya perlu deteksi outlier (saya pikir?). Saya sudah membaca beberapa pendekatan di sini …


3
Mengapa dimensi VC penting?
Wikipedia mengatakan bahwa: Dimensi VC adalah kardinalitas set poin terbesar yang dapat dihancurkan algoritma. Sebagai contoh, classifier linier memiliki kardinalitas n +1. Pertanyaan saya adalah mengapa kita peduli? Sebagian besar dataset yang Anda lakukan klasifikasi linier cenderung sangat besar dan mengandung banyak poin.

3
Bagaimana cara membangun matriks kebingungan untuk classifier multiclass?
Saya punya masalah dengan 6 kelas. Jadi saya membangun classifier multiclass, sebagai berikut: untuk setiap kelas, saya memiliki satu classifier Logistic Regression, menggunakan One vs All, yang berarti saya memiliki 6 classifier yang berbeda. Saya dapat melaporkan matriks kebingungan untuk masing-masing pengklasifikasi saya. Tapi, saya ingin melaporkan matriks kebingungan untuk …

1
Bagaimana meningkatkan gradien menghitung estimasi probabilitas?
Saya telah mencoba memahami peningkatan gradien membaca berbagai blog, situs web dan mencoba menemukan jawaban saya dengan melihat contohnya misalnya kode sumber XGBoost. Namun, saya tidak bisa menemukan penjelasan yang dapat dimengerti tentang bagaimana algoritma peningkatan gradien menghasilkan estimasi probabilitas. Jadi, bagaimana mereka menghitung probabilitas?

5
Mengapa kami menolak hipotesis nol pada level 0,05 dan bukan pada level 0,5 (seperti yang kami lakukan di Klasifikasi)
Pengujian hipotesis mirip dengan masalah Klasifikasi. Jadi katakanlah, kami memiliki 2 label yang memungkinkan untuk pengamatan (subjek) - Bersalah vs. Tidak Bersalah. Biarkan Non-Bersalah menjadi Hipotesis nol. Jika kita melihat masalah dari sudut pandang Klasifikasi, kita akan melatih Klasifikasi yang akan memprediksi probabilitas subjek yang termasuk dalam masing-masing dari 2 …

2
Pembelajaran inkremental untuk model klasifikasi di R
Asumsikan, saya memiliki classifier (Ini bisa berupa pengklasifikasi standar seperti pohon keputusan, hutan acak, regresi logistik, dll.) Untuk deteksi penipuan menggunakan kode di bawah ini library(randomForest) rfFit = randomForest(Y ~ ., data = myData, ntree = 400) # A very basic classifier Say, Y is a binary outcome - Fraud/Not-Fraud …

2
Mengapa Bayes Classifier adalah classifier yang ideal?
Ini dianggap sebagai kasus ideal di mana struktur probabilitas yang mendasari kategori dikenal dengan sempurna. Mengapa dengan Bayes classifier kita mencapai kinerja terbaik yang bisa dicapai? Apa bukti / penjelasan formal untuk ini? Karena kami selalu menggunakan pengklasifikasi Bayes sebagai tolok ukur untuk membandingkan kinerja semua pengklasifikasi lainnya.

3
Apa fungsi kerugian yang harus digunakan untuk mendapatkan classifier biner yang presisi atau tinggi?
Saya mencoba membuat detektor objek yang sangat jarang terjadi (dalam gambar), berencana untuk menggunakan classifier biner CNN yang diterapkan pada jendela geser / ukuran. Saya telah membangun pelatihan 1: 1 positif-negatif yang seimbang dan set tes (apakah itu hal yang benar untuk dilakukan dalam kasus seperti itu?), Dan classifier baik-baik …

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.