Pertanyaan yang diberi tag «classification»

Klasifikasi statistik adalah masalah mengidentifikasi sub-populasi yang menjadi tempat pengamatan baru, di mana identitas sub-populasi tidak diketahui, berdasarkan pada serangkaian pelatihan data yang berisi pengamatan yang sub-populasi diketahui. Oleh karena itu klasifikasi ini akan menunjukkan perilaku variabel yang dapat dipelajari oleh statistik.

3
Mesin Boltzmann Terbatas untuk regresi?
Saya menindaklanjuti pertanyaan yang saya tanyakan sebelumnya pada RBM . Saya melihat banyak literatur menggambarkan mereka tetapi tidak ada yang benar-benar berbicara tentang regresi (bahkan klasifikasi dengan data berlabel). Saya merasa bahwa ini hanya digunakan untuk data tidak berlabel. Apakah ada sumber daya untuk menangani regresi? Atau sesederhana menambahkan lapisan …



2
Mengapa n-gram digunakan dalam identifikasi bahasa teks, bukan kata-kata?
Dalam dua perpustakaan identifikasi bahasa populer, Compact Language Detector 2 untuk C ++ dan bahasa detektor untuk java, keduanya menggunakan (berbasis karakter) n-gram untuk mengekstraksi fitur teks. Mengapa kantung kata-kata (satu kata / kamus) tidak digunakan, dan apa keuntungan dan kerugian kantung kata-kata dan n-gram? Juga, apa kegunaan lain dari …

2
Bagaimana cara menghitung bobot kriteria Fisher?
Saya mempelajari pengenalan pola dan pembelajaran mesin, dan saya mengalami pertanyaan berikut. Pertimbangkan masalah klasifikasi dua kelas dengan probabilitas kelas sebelumnya yang samaP(D1)=P(D2)=12P(D1)=P(D2)=12P(D_1)=P(D_2)= \frac{1}{2} dan distribusi instance di setiap kelas yang diberikan oleh p(x|D1)=N([00],[2001]),p(x|D1)=N([00],[2001]), p(x|D_1)= {\cal N} \left( \begin{bmatrix} 0 \\0 \end{bmatrix}, \begin{bmatrix} 2 & 0 \\ 0 & 1 …

5
Bagaimana cara melakukan imputasi nilai dalam jumlah poin data yang sangat besar?
Saya memiliki dataset yang sangat besar dan sekitar 5% nilai acak hilang. Variabel-variabel ini berkorelasi satu sama lain. Contoh berikut dataset R hanyalah contoh mainan dengan data berkorelasi dummy. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", 1:10000, …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 

1
Bagaimana saya melatih HMM untuk klasifikasi?
Jadi saya mengerti bahwa ketika Anda melatih HMM untuk klasifikasi, pendekatan standarnya adalah: Pisahkan set data Anda ke dalam set data untuk setiap kelas Latih satu HMM per kelas Pada set tes, bandingkan kemungkinan masing-masing model untuk mengklasifikasikan setiap jendela Tapi bagaimana cara melatih HMM di setiap kelas? Apakah saya …


2
Mengapa menambah jumlah fitur mengurangi kinerja?
Saya mencoba mendapatkan intuisi mengapa peningkatan jumlah fitur dapat mengurangi kinerja. Saat ini saya menggunakan classifier LDA yang berkinerja lebih baik secara bivariat di antara fitur-fitur tertentu tetapi lebih buruk ketika melihat lebih banyak fitur. Akurasi klasifikasi saya dilakukan dengan menggunakan xval bertingkat 10 kali lipat. Apakah ada kasus sederhana …


2
PCA dan hutan acak
Untuk kompetisi Kaggle baru-baru ini, saya (secara manual) mendefinisikan 10 fitur tambahan untuk set pelatihan saya, yang kemudian akan digunakan untuk melatih classifier hutan acak. Saya memutuskan untuk menjalankan PCA pada dataset dengan fitur-fitur baru, untuk melihat bagaimana mereka dibandingkan satu sama lain. Saya menemukan bahwa ~ 98% varians dibawa …


1
Apakah pelatihan yang jarang dilakukan berdampak buruk pada SVM?
Saya mencoba untuk mengklasifikasikan pesan ke dalam kategori yang berbeda menggunakan SVM. Saya telah menyusun daftar kata / simbol yang diinginkan dari set pelatihan. Untuk setiap vektor, yang mewakili pesan, saya mengatur baris yang sesuai 1jika kata tersebut ada: "corpus" adalah: [mary, little, lamb, star, twinkle] pesan pertama: "mary had …

2
Menerapkan pembelajaran mesin untuk penyaringan DDoS
Dalam kursus Pembelajaran Mesin Stanford, Andrew Ng menyebut penerapan ML di bidang TI. Beberapa waktu kemudian ketika saya mendapat ukuran sedang (sekitar 20k bot) DDoS di situs kami, saya memutuskan untuk melawannya menggunakan classifier Neural Network sederhana. Saya telah menulis skrip python ini dalam waktu sekitar 30 menit: https://github.com/SaveTheRbtz/junk/tree/master/neural_networks_vs_ddos Menggunakan …

2
Memprediksi banyak target atau kelas?
Misalkan saya sedang membangun model prediksi di mana saya mencoba untuk memprediksi beberapa peristiwa (misalnya, gulungan dadu dan lemparan koin). Sebagian besar algoritma yang saya kenal bekerja dengan hanya satu target, jadi saya bertanya-tanya apakah ada pendekatan standar untuk hal semacam ini. Saya melihat dua opsi yang memungkinkan. Mungkin pendekatan …

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.